logo
languageITdown
menu

RegEx: Come Estrapolare Tutti i Numeri Telefono da Stringhe

5 minuti di lettura

A volte uno strumento RegEx può aiutarti a uscire dai materiali didattici perplessi e rendere la scrittura di Regex facilissima. Questa è una guida rapida per principianti sull’uso delle espressioni regolari per estrarre numeri di telefono da stringhe.

Cos’è RegEx

RegEx indica Espressione Regolare, che è un oggetto che descrive il pattern di una stringa. Con questa espressione comprensibile per il computer, siamo in grado di individuare i dati che corrispondono a questo pattern ed estrapolare le informazioni desiderate.

“Un’espressione regolare (abbreviata come regex o regexp; anche nota come espressione razionale) è una sequenza di caratteri che specifica un pattern di ricerca”.

—— Citato da Wikipedia.com

Come ci aiuta un’espressione regolare a estrarre i numeri di telefono da un lungo testo?

Ad esempio, stai cercando un modo per estrarre contemporaneamente tutti i numeri di telefono dal testo. Questo intero testo ha numerose serie di numeri di telefono sparse qua e là in modo casuale. Devi essere familiare con la formula “CONTROL + F”, che è integrata nella maggior parte delle applicazioni per aiutare gli utenti a trovare e evidenziare una certa stringa di dati.

Se sei in grado di scrivere un codice di espressione regolare che descrive lo stesso pattern di questi numeri di telefono, puoi inserire questo codice in un editor di testo con capacità regex integrata attraverso la funzione “trova” e i dati che stai cercando saranno ben localizzati.

Come scrivere un’espressione regolare

Se vuoi estrarre numeri di telefono usando le espressioni regolari ma non sai come scriverne una, questo articolo potrebbe aiutarti in questo.

#Impara alcune nozioni di RegEx

Imparare RegEx da zero potrebbe richiedere del tempo, mentre se lo userai frequentemente nel tuo lavoro quotidiano e quindi migliorerà significativamente la tua produttività, potrebbe valere la pena provarlo.

Un buon punto di partenza sono i tutorial RegEx di JS in W3School. Imparerai la sintassi di base di un codice RegEx e la grammatica dei modificatori e dei quantificatori.

Poiché questo è piuttosto complicato da comprendere per i principianti assoluti, non ci addentreremo in questo in questo articolo. Se vuoi trovare un modo facile per trarre vantaggio da RegEx, RegEx sarà adatto alle tue esigenze immediate.

#Usa lo strumento RegEx integrato in Octoparse

Ci sono alcuni strumenti pronti all’uso che aiutano le persone a scrivere RegEx in modo piuttosto semplice. Octoparse ha uno strumento integrato per fare il lavoro.

strumento espressione regolare

Scarica Octoparse

Con questo strumento intuitivo a portata di mano, l’unica cosa a cui devi prestare attenzione è trovare il pattern dei numeri di telefono che stai cercando in tutto il testo.

Per coloro che non conoscono ancora Octoparse, Octoparse è uno strumento di web scraping facile da usare. Aiuta le persone che hanno bisogno di enormi fonti di contenuti a raccogliere contenuti da qualsiasi sito web in poco tempo e, soprattutto, senza conoscere alcun linguaggio di programmazione. Rispetto agli altri, il suo punto forte è la modalità boost, il design intuitivo dell’interfaccia utente, e così via. Vale la pena menzionare che la sua funzione di rilevamento automatico unica può risparmiarti un sacco di lavoro cliccando perplessamente con risultati di dati confusi.

Oltre alla funzione di rilevamento automatico, i modelli predefiniti sono ancora più convenienti. Utilizzando i modelli, puoi ottenere le informazioni sulla lista dei prodotti così come le informazioni dettagliate sulla pagina sul sito web desiderato. Octoparse fornisce un buon numero di modelli predefiniti che aiutano a raccogliere dati da varie pagine web come Amazon, eBay, PagineGialle, Twitter, ecc. Può aiutarti a raccogliere informazioni dai social media per aiutarti a monitorare argomenti di tendenza e interessi delle persone. D’altra parte, puoi anche creare un crawler più personalizzato da solo sotto la modalità avanzata. Per fare ciò, puoi creare i tuoi flussi di scraping per ottenere i dati richiesti in pochi passaggi.

Sono offerte funzioni potenti come il servizio cloud, lo scraping automatico programmato e la rotazione IP (per evitare il ban dell’IP) in un piano a pagamento. Se vuoi monitorare numeri di magazzino, prezzi e altre informazioni su una serie di negozi/prodotti su base regolare, Octoparse è sicuramente uno strumento utile. Se non hai ancora iniziato il tuo viaggio di web scraping, ti consigliamo di provare Octoparse.

Esempi di estrazione di numeri di telefono utilizzando RegEx

Potrebbero esserci più numeri di telefono in una singola stringa grande e questi numeri di telefono potrebbero essere presentati in una varietà di formati. Ecco un esempio del formato del file:

  • (021)1234567
  • (123) 456 7899
  • (123).456.7899
  • (123)-456-7899
  • 123-456-7899
  • 123 456 7899
  • 1234567899
  • 0511-4405222
  • 021-87888822
  • +8613012345678

Qual è il modo più semplice per estrarre numeri di telefono come questi? Ora useremo lo strumento Espressione Regolare per generare Espressioni Regolari e abbinare tutti i numeri di telefono rapidamente.

Innanzitutto, trova il carattere comune con cui inizia e finisce ciascun numero di telefono. Ad esempio, per il testo di destinazione sopra, trovo il suo codice sorgente mostrato di seguito.

<p>Ecco un esempio di formato del file </p>

<ul>

  <li>(021)1234567 </li>

  <li>(123) 456 7899 </li>

  <li>(123).456.7899 </li>

  <li>(123)-456-7899 </li>

  <li>123-456-7899 </li>

  <li>123 456 7899 </li>

  <li>1234567899 </li>

  <li>0511-4405222 </li>

  <li>021-87888822 </li>

  <li>+8613012345678 </li>

  <li>… </li>

</ul>

Ogni numero di telefono inizia con <li> e finisce con </li>. E possiamo usare lo strumento RegEx in Octoparse per estrarre rapidamente tutti i numeri di telefono.

Passaggio 1. Avviare l’APP Octoparse e aprire lo strumento RegEx.

Passaggio 2. Copiare e incollare il codice sorgente nella casella “Testo originale”. Selezionare quindi l’opzione “Inizia con” e inserisci “<li>”.

Passaggio 3. Successivamente, seleziona l’opzione “Termina con” e inserisci “</li>”. Non dimenticare di selezionare l’opzione “Abbinamento a tutti”.

Passaggio 4. Fai clic su “Adatta”. Quando è fatto, tutti i numeri di telefono abbinati sono elencati nella casella sul lato sinistro.

Passaggio 5: Copiare e incollare l’intero risultato in excel o altri documenti, il testo si divide in riga per riga.

numeri in excel

Tuttavia, se non riesci a trovare le caratteristiche comuni con cui inizia e finisce ciascun numero di telefono, lo strumento non sarà sufficiente per generare un codice Regex. Potresti aver bisogno di equipaggiarti con più conoscenze sulla sintassi di Regex e scrivere un’espressione regolare speciale per ciascun pattern.

Vediamo altre due Espressioni Regolari di esempio per due formati di numeri di telefono.

  • Espressione Regolare 1:

Codice: \d{3}-\d{8}|\d{4}-\d{7}

Corrispondenza: 0511-4405222 | 021-87888822

espressione regolare 1
numeri 1
  • Espressione Regolare 2:

Codice: \(\d{2,4}\)\d{6,7}

Corrispondenza: (021)1234567 | (0411)123456 | (000)000000 |(123)1234567

espressione regolare 2
numeri 2

Trovare un pattern di numeri di telefono tra il testo e trovare un codice RegEx che descrive il pattern è la chiave di questo compito.

Articoli popolari

Esplora argomenti

Inizia a usare Octoparse oggi

Scarica

Articoli correlati