Skip to content

CLI tool berbasis Python untuk scraping review produk Tokopedia secara otomatis dan menyimpannya ke CSV. Cocok untuk developer, peneliti, dan praktisi NLP.

License

Notifications You must be signed in to change notification settings

RozhakDev/TokopediaNLPy

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

TokopediaNLPy

TokopediaNLPy adalah script Python sederhana untuk mengumpulkan (scrape) data review produk dari Tokopedia, lalu menyimpannya ke file CSV. Cocok banget buat riset, analisis sentimen, dan proyek Natural Language Processing (NLP)!

Fitur

  • Output data review format CSV, siap olah untuk NLP.
  • Ambil informasi rating, isi review, waktu, varian, jumlah like, dan respons seller.
  • Scrape otomatis semua halaman review.
  • Scraping review produk Tokopedia dari URL.

Instalasi

Install dependency utama:

pip install requests

Library lain (argparse, csv, logging, dsb) sudah ada di Python 3.x.

Pemakaian

python src/scraper.py "URL_PRODUK_TOKOPEDIA" -o nama_file.csv

Contoh:

python src/scraper.py "https://www.tokopedia.com/rozhak-store/barang-unik" -o review_output.csv

Otomatis semua review akan disimpan dalam file CSV yang kamu tentukan.

Contoh CSV

review_id rating message timestamp variant likes seller_response
1234567890 5 Bagus banget! 2024-06-01T17:11 Biru 3 Terima kasih!

Catatan

  • Pakai URL produk Tokopedia yang valid (format: https://www.tokopedia.com/...)
  • Tunggu proses scraping, jangan terlalu cepat agar tidak diblok Tokopedia.
  • Data hasil CSV langsung bisa digunakan untuk proyek data science atau NLP kamu.

License

MIT License.
Bebas dipakai, diedit, atau dicinta-cintai~ 😘

About

CLI tool berbasis Python untuk scraping review produk Tokopedia secara otomatis dan menyimpannya ke CSV. Cocok untuk developer, peneliti, dan praktisi NLP.

Topics

Resources

License

Stars

Watchers

Forks