![]() |
Second Opinion
Folosind serviciul second opinion ne puteți trimite RMN-uri, CT -uri, angiografii, fișiere .pdf, documente medicale. Astfel vă vom putea da o opinie neurochirurgicală, fără ca aceasta să poată înlocui un consult de specialitate. Răspunsurile vor fi date prin e-mail în cel mai scurt timp posibil (de obicei în mai putin de 24 de ore, dar nu mai mult de 48 de ore). Second opinion – Neurohope este un serviciu gratuit. www.neurohope.ro |
O mica problema de Regex.
Last Updated: Jan 29 2022 11:44, Started by
ursudepadure
, Jan 27 2022 21:01
·
0

#1
Posted 27 January 2022 - 21:01

Poate ca ar trebui sa studiez mai mult inainte sa intreb dar ma dau batut.
Am ceva de genul. 1. Titlu Continut, blah blah intr-un paragraph (pana la new line). Alt Continut....in alt paragraf. Alt continut....etc. ________________________________________ Mi.ar trebui ceva care sa imi match-uiasca paragrafele (in acest caz 3 si se cunoste numele titlului cum ar fi "introducere" sau "concluzii", etc.) Ideea este ca intre titlu si paragrafe pot sa fie zero (Titlul sa faca parte din primul paragraf) sau mai multe linii goale. Patternul ar trebui sa extraga Paragrafele de dupa titlu (care sunt n, un numar dat, sa zicem 3 pentru un caz particular.). Daca nu e posibil, cel putin sa extraga primul paragraf. |
#2
Posted 27 January 2022 - 21:42

In ce limbaj vrei sa faci?
iti trebuie o metoda de-a deosebi titlul de restul textului, daca e numerotat atunci faci match la cuvintele care incep cu o cifra. Posibil sa apara si false positive dar... vezi tu. In python poti folosi with open: https://stackoverflo...le-line-by-line Citesti fisierul line by line, verifici daca e titlu, daca e tiltu il stochezi intr-o variabila, apoi continutul in alta variabila pana dai de urmatorul titlu. Cand citesti fiecare linie verifici si daca e goala si ignori daca vrei sa ignori liniile goale. Edited by vj_Heaven, 27 January 2022 - 21:46. |
#3
Posted 27 January 2022 - 22:17

Cand e vorba de parsat HTML , the way to go is ALWAYS XPATH !!!
|
#4
Posted 27 January 2022 - 23:56

Poate ca ar trebui sa studiez mai mult inainte sa intreb dar ma dau batut. Am ceva de genul. 1. Titlu Continut, blah blah intr-un paragraph (pana la new line). Alt Continut....in alt paragraf. Alt continut....etc. ________________________________________ Mi.ar trebui ceva care sa imi match-uiasca paragrafele (in acest caz 3 si se cunoste numele titlului cum ar fi "introducere" sau "concluzii", etc.) Ideea este ca intre titlu si paragrafe pot sa fie zero (Titlul sa faca parte din primul paragraf) sau mai multe linii goale. Patternul ar trebui sa extraga Paragrafele de dupa titlu (care sunt n, un numar dat, sa zicem 3 pentru un caz particular.). Daca nu e posibil, cel putin sa extraga primul paragraf. |
#5
Posted 29 January 2022 - 11:44

Nu neaparat un numar la inceput. Poate sau nu poate sa fi un numar. Ceea ce nu stiu este sa fac un pattern care sa cuprinda toate situatiile posibile (sau cel putin o mare parte din ele) care sa imi extraga continutul unui paragraf atunci cand intalneste un titlu dat. Sau si mai bine, mai multe paragraphe.
Poate nu sunt in sectinuea potrivita. Regex e folosit in toate limbajele si eu am mai pus intrebari la partea de programare in C# dar acolo sunt mai putini utilizatori ai formului. Limbajul? Nu conetaza deloc. Sunt pe net o groaza de aplicatii online (webtools) cu care sa verifici paternul si merge la fel in web tool ca si in aplicatiile mele. Eu folosesc C# si am creat propriul program care sa imi testeze paternurile si rezultatele sunt ca cele de pe webtool cum e acesta: https://regex101.com/ |
Anunturi
▶ 0 user(s) are reading this topic
0 members, 0 guests, 0 anonymous users