Octoparse CLI

Octoparse,dal tuo terminal.

Il motore di dati web che il tuo team può eseguire da laptop, pipeline CI o dentro l agente AI che lancerai presto: stesso binario, stesso contratto.

Leggi la documentazione

Prova gratuita · senza carta di credito
Cross-platform
Contratto stabile

Tre team. Un binario

Stessa CLI. Stessi codici di uscita. Stesso contratto JSON, che venga eseguita su laptop, in CI o dentro un loop di agenti.

Developer

Una installazione npm. Esegui in locale con un motore incluso: le righe estratte non lasciano mai la macchina.

Team DevOps

Inseriscila in GitHub Actions, Docker, Airflow o cron. Codici di uscita stabili e autenticazione via variabili ambiente che non tocca mai il disco: supera la revisione sicurezza al primo giro.

Agenti AI

Passa la CLI a Claude, Cursor o al tuo loop di agenti. Lo streaming JSONL permette all agente di pianificare il passo successivo prima della fine della run.

Un comando. Tre storie di deployment

Lo stesso binario sul laptop, nella pipeline CI o dentro un agente: abbastanza prevedibile da entrare nella rotazione di reperibilità.

“Mi serve questo CSV prima dello standup.”

Un growth analyst estrae ogni mattina prezzi concorrenti in un notebook Jupyter. Una run + un export dati: foglio fresco prima del caffè, senza dover sorvegliare Selenium.

$ octoparse run lp-pricing
✓ 248 rows → pricing.csv

Tempo di setup~ 90 secondi

Runtime giornaliero< 3 min

“Collegalo alla nostra estrazione settimanale.”

Un team dati retail esegue estrazioni programmate in CI ogni lunedì alle 06:00 UTC. Codici di uscita stabili instradano i successi a valle e i fallimenti alla reperibilità: zero container da mantenere.

# .github/workflows/pull.yml
- run: octoparse run $TASK --json
- run: dbt build

Alert reperibilità7 → 0 / mese

Stack risparmiatoFlotta Selenium

“Consegna la CLI al mio agente come strumento.”

Una startup vertical-AI espone la CLI dentro Claude / Cursor come tool strutturato. Lo streaming JSONL fornisce feedback riga per riga, così l agente può pianificare il passo successivo prima della fine della run.

tool: octoparse.run
stream: jsonl
next_action: enrich rows

Robustezzagarantita

Tempo di setup< 2 secondi

Il motore di dati web a cui i team tornano

Sei ragioni per cui i clienti scelgono Octoparse e restano.

Copertura globale pronta all'uso

Oltre 200 template pronti all'esecuzione: Amazon, LinkedIn, Google Maps, YouTube, Yelp, HN, Reddit e altro ancora. Una struttura REST, gli stessi campi canonici, senza manutenzione di XPath o selettori.

8 anni di infrastruttura di scraping

Pool di browser, rotazione proxy, anti-bot, paginazione, export strutturato: testato sul campo dal 2018.

I tuoi dati. Le tue regole.

Le tue run, i tuoi byte. Non rivendiamo, non redistribuiamo e non addestriamo modelli sui dati che estraiamo per te. Imposta una finestra di conservazione, premi elimina ed è fatto. Ogni run riceve un trace_id che puoi verificare o rieseguire.

Output strutturato in ogni formato

JSON, JSONL, CSV, XLSX, XML: la stessa forma canonica. Invia direttamente a Snowflake tramite Airbyte, dbt, Airflow o il tuo ETL.

Progettato per l'AI fin dal primo giorno

Funziona nativamente con Claude, GPT, Cursor, Cline, Dify e LangChain. Lo streaming JSONL permette al tuo agente di pianificare il passo successivo prima della fine della run.

Miglior valore nella categoria

Prova gratuita, senza carta di credito. Prezzi trasparenti a consumo in seguito. I team segnalano di sostituire stack interni di scraping a 1/18 del costo del personale.

Così silenzioso da non svegliarti mai

Costruito su otto anni di infrastruttura di scraping e sul feedback di team che lo eseguono già in produzione.

3M+ore di esecuzione cloud

99,97%disponibilità cloud · 90 giorni

31benchmark OS

8 anniinfrastruttura di scraping

"Siamo passati da una flotta Selenium su tre istanze EC2 a una singola invocazione CLI in GitHub Actions."

Ravi P.Staff DevOps · piattaforma retail D2C

"Il nostro loop di agenti la chiama come tool. Lo streaming JSONL consente di pianificare il passo successivo prima della fine. Un grande passo avanti per la UX."

Elena N.Founding engineer · startup vertical-AI

"Codici di uscita stabili, auth tramite variabili ambiente: ha superato la nostra revisione sicurezza al primo giro. Con gli strumenti di scraping succede raramente."

Thomas K.Architetto della sicurezza · Enterprise SaaS

A supporto dei team dati e AI presso

Lumen LabsNorthwindQuanta AIDrift RetailHelio CapitalMosaic.ioPlurabankFieldNoteStride HealthArgon FoodsPivotsoftCobalt & Co.

Domande frequenti

In cosa la CLI è diversa da API o MCP?

La CLI è gratuita?

Quali sistemi operativi sono supportati?

Come la uso in GitHub Actions / Docker / su un server?

Quando eseguire in locale e quando nel cloud?

Ritira lo scraper. Tieni i dati

Prova gratuita. Nessuna carta di credito. La maggior parte dei team lo esegue in CI prima dello standup quotidiano.

PROVA GRATUITA

Parla con le vendite