Cara Paling Malas dan Gampang Lakukan Web Scraping untuk AGC atau Autoblog

Bagi pemain AGC (Auto Generated Content) atau autoblog proses gathering data adalah pekerjaan yang biasa dilakukan. Proses gathering data ini dapat dilakukan dengan memanfaatkan fasilitas API yang sudah disediakan oleh penyedia data (web yang menjadi sumber data) atau menggunakan teknik scraping.

Berbeda dengan gathering dengan menggunakan API, proses scraping ini kita dapat mengambil data walapun web yang dijadikan sumber data tidak menyediakan fasilitas untuk proses pengambilan data yang diinginkan.

Proses gathering data dengan API jauh lebih mudah, karena kita hanya perlu mengirimkan parameter yang diperlukan dan web sumber akan menjawab dengan sepaket data yang kita inginkan. Sedangkan jika kita ingin menggunakan teknik scraping maka kita harus memahami struktur web yang dijadikan target atau sumber data.

Berikut adalah tools yang dapat diperlajari untuk lakukan parsing data saat lakukan proses scraping web dengan PHP:

  • PHP Simple HTML DOM Parser – http://simplehtmldom.sourceforge.net
  • DOM Document – http://php.net/manual/en/class.domdocument.php

Penggunaan PHP Simple HTML DOM Parser menurut saya sangat mudah, namun konon katanya dari segi kecepatan jauh lebih baik menggunakan DOM Document.

Ada sebuah tool lagi yang menurut saya layak dicoba, ini khusus bagi Anda yang termasuk manusia paling malas sejagad raya, udah males bikin artikel, malas lakukan copy-maste, malas lihat struktur web target, malas lakukan koding untuk parsing, tapi… gak malas dapat earning…