Python - extrag email din fisier text
Last Updated: Feb 08 2016 22:11, Started by
pd
, Feb 08 2016 19:55
·
0
#1
Posted 08 February 2016 - 19:55
Buna!
Am tot cautat pe forumuri o solutie pentru a extrage email-uri dintr-un fisier text. Programelul l-am scris in python si am folosit regular expresions (Regex). Reusesc sa extrag doar email-uri care nu contin spatii, dar nu am reusit sa extrag un email de genul: name2 @ email . com Am nevoie de codul care extrage emailul gasit scris atat corect (fara spatii) cat si cu spatii (cum am exemplificat mai sus). Pun mai jos exemplu de fisier text si codul pe care l-am scris: xxx [email protected] xxxx xxxxxxxx xxx test2 @ email . com xxx xxxxxxx xxx [email protected] xxx xxxxxxxxxxx Codul: import re a = open('emails.txt') for line in a: line = line.rstrip() if re.search(r'[\w.-]+@[\w.-]+',line): z = re.findall(r'[\w.-]+@[\w.-]+',line) print (z[0]) Returneaza doar: [email protected] [email protected] |
#2
Posted 08 February 2016 - 21:18
Adauga spatii optionale in regex. Simbolul pentru spatiu e \s
Iar optionale le faci cu * Asadar: \s* |
#3
Posted 08 February 2016 - 22:11
Multumesc de raspuns!
Nu stiu care ar fi sintaxa (cum as putea sa scriu) ca spatiul optional sa fie doar cel care are vecin . sau @ |
Anunturi
Bun venit pe Forumul Softpedia!
▶ 0 user(s) are reading this topic
0 members, 0 guests, 0 anonymous users