TokopediaNLPy adalah script Python sederhana untuk mengumpulkan (scrape) data review produk dari Tokopedia, lalu menyimpannya ke file CSV. Cocok banget buat riset, analisis sentimen, dan proyek Natural Language Processing (NLP)!
- Output data review format CSV, siap olah untuk NLP.
- Ambil informasi rating, isi review, waktu, varian, jumlah like, dan respons seller.
- Scrape otomatis semua halaman review.
- Scraping review produk Tokopedia dari URL.
Install dependency utama:
pip install requests
Library lain (argparse, csv, logging, dsb) sudah ada di Python 3.x.
python src/scraper.py "URL_PRODUK_TOKOPEDIA" -o nama_file.csv
Contoh:
python src/scraper.py "https://www.tokopedia.com/rozhak-store/barang-unik" -o review_output.csv
Otomatis semua review akan disimpan dalam file CSV yang kamu tentukan.
review_id | rating | message | timestamp | variant | likes | seller_response |
---|---|---|---|---|---|---|
1234567890 | 5 | Bagus banget! | 2024-06-01T17:11 | Biru | 3 | Terima kasih! |
- Pakai URL produk Tokopedia yang valid (format:
https://www.tokopedia.com/...
) - Tunggu proses scraping, jangan terlalu cepat agar tidak diblok Tokopedia.
- Data hasil CSV langsung bisa digunakan untuk proyek data science atau NLP kamu.
MIT License
.
Bebas dipakai, diedit, atau dicinta-cintai~ 😘