แกะ Link ทั้งหมดด้วย cyberneko (Groovy Java)

แกะ Link ทั้งหมดด้วย cyberneko (Groovy Java)

29 เมษายน 2010

แกะ Link ทั้งหมดด้วย cyberneko (Groovy Java) จาก code ข้างบน จะเป็นการแกะ link ออกมาเฉพาะลิ้งค์ที่มีคำว่า id groovy -cp nekohtml.jar:xml-apis.jar:xercesImpl.jar nekoReg.groovy Related Blogs

Set Encoding ให้ Cyberneko แล้วก็ Grep Image Source

Set Encoding ให้ Cyberneko แล้วก็ Grep Image Source

20 เมษายน 2010

Set Encoding ให้ Cyberneko html parser (บาง Site ไม่ยอมกำหนดว่าเป็น Encoding แบบใด) แล้วก็ Grep Image Source Code ตามข้างล่างนี้

Get Adobe Flash playerPlugin by wpburn.com wordpress themes