แกะ Link ทั้งหมดด้วย cyberneko (Groovy Java)
29 เมษายน 2010
แกะ Link ทั้งหมดด้วย cyberneko (Groovy Java) จาก code ข้างบน จะเป็นการแกะ link ออกมาเฉพาะลิ้งค์ที่มีคำว่า id groovy -cp nekohtml.jar:xml-apis.jar:xercesImpl.jar nekoReg.groovy Related Blogs
Set Encoding ให้ Cyberneko แล้วก็ Grep Image Source
20 เมษายน 2010
Set Encoding ให้ Cyberneko html parser (บาง Site ไม่ยอมกำหนดว่าเป็น Encoding แบบใด) แล้วก็ Grep Image Source Code ตามข้างล่างนี้


