OT: regular expressions
am 10.09.2006 21:47:11 von joe
Hallo,
hat zwar nur ferner was mit php zu tun, aber hier sind sicherlich einige
Leute die sich mit sowas auskennen.
Ich habe ein whois client geschrieben der dann sagt ob eine Domain frei ist
oder nicht. Nun will ich die Domain auch noch auf Gültigkeit prüfen.
Ich bin soweit, dass es alles filtert was nicht reingehört, wie z.b. Punkte
und Bindestriche am Anfang und Ende. Jetzt muss ich noch Doppelte oder n mal
nacheinander kommende Bindestriche finden, nicht jedoch bla-bla-bla sondern
nur bla--bla oder bla---bla. Ich habs mit -* und -+ versucht, funktioniert
aber nicht da es mir dann auch bla-bla-bla filtert. Kann mir jemand
weiterhelfen?
Gruß Joe
--
GnuPG Fingerprint: DF40 BBF5 3B11 F2A7 8A42 73E4 34AE 9401 8FB3 06C4
() ascii ribbon campaign
/\ against html in mail and news
http://www.realname-diskussion.info - Realnames sind keine Pflicht
Re: OT: regular expressions
am 11.09.2006 12:04:22 von dev-null-use-reply-adress
Irgendwer oder -was schrieb:
> hat zwar nur ferner was mit php zu tun, aber hier sind sicherlich einige
> Leute die sich mit sowas auskennen.
http://develnet.org/66.html
> Jetzt muss ich noch Doppelte oder n mal
> nacheinander kommende Bindestriche finden, nicht jedoch bla-bla-bla sondern
> nur bla--bla oder bla---bla. Ich habs mit -* und -+ versucht, funktioniert
> aber nicht da es mir dann auch bla-bla-bla filtert. Kann mir jemand
> weiterhelfen?
http://de.php.net/manual/de/reference.pcre.pattern.syntax.ph p#regexp.reference.repetition
> http://www.realname-diskussion.info - Realnames sind keine Pflicht
Antworten selbstverständlich auch nicht.
Gruß
JPM
Re: OT: regular expressions
am 11.09.2006 15:31:24 von Knut Kohl
Hallo Joe,
Joe schrieb am 10. Sep 2006 in de.comp.lang.php.misc:
> Ich bin soweit, dass es alles filtert was nicht reingehört, wie z.b. Punkte
> und Bindestriche am Anfang und Ende. Jetzt muss ich noch Doppelte oder n mal
> nacheinander kommende Bindestriche finden, nicht jedoch bla-bla-bla sondern
> nur bla--bla oder bla---bla. Ich habs mit -* und -+ versucht, funktioniert
> aber nicht da es mir dann auch bla-bla-bla filtert. Kann mir jemand
> weiterhelfen?
Hint: --+ oder -{2,}
wobei ABC----DEF.de eigentlich gültig ist, nur -- an 3. und 4. Stelle
nicht, also z.B. AB--CDE.de ist ungültig.
PS. Du beachtest auch z.B. Deutsche Umlaute?
(http://www.denic.de/de/domains/idns/index.html)
Tja, niemand hat gesagt, es wäre einfach... :-)
Regards,
Knut
--
Newsoffice.de - Die Onlinesoftware zum Lesen und Schreiben im Usenet
Re: OT: regular expressions
am 12.09.2006 15:12:14 von Alex Hepp
Knut Kohl schrieb:
> Hallo Joe,
>
> wobei ABC----DEF.de eigentlich gültig ist, nur -- an 3. und 4. Stelle
> nicht, also z.B. AB--CDE.de ist ungültig.
Das ist ja interessant, wusste ich garnicht! Meinst Du xn--, denn das
ist zur Übertragung für internationalisierte Domains reserviert. aber
auch das sollte dann eine gültige adresse sein.
> Tja, niemand hat gesagt, es wäre einfach... :-)
Full ACK ;)
lg alex
Re: OT: regular expressions
am 12.09.2006 17:26:46 von Knut Kohl
Hallo Alex,
Alex Hepp schrieb am 12. Sep 2006 in de.comp.lang.php.misc:
>> wobei ABC----DEF.de eigentlich gültig ist, nur -- an 3. und 4. Stelle
>> nicht, also z.B. AB--CDE.de ist ungültig.
> Das ist ja interessant, wusste ich garnicht! Meinst Du xn--, denn das
> ist zur Übertragung für internationalisierte Domains reserviert. aber
> auch das sollte dann eine gültige adresse sein.
siehe http://www.denic.de/de/richtlinien.html - Punkt V.
Das mit den 2 Bindestrichen ist NICHT nur für DE gültig sondern
allgemein.
Das kannst Du auch prima bei der DENIC selber testen...
Dein whois-client sollte aa--bcd.TLD auch anmeckern.
> lg alex
Knut
--
Newsoffice.de - Die Onlinesoftware zum Lesen und Schreiben im Usenet
Re: OT: regular expressions
am 13.09.2006 14:13:10 von Julian Bessenroth
Joe schrieb:
> Ich bin soweit, dass es alles filtert was nicht reingehört, wie z.b. Pu=
nkte
> und Bindestriche am Anfang und Ende. Jetzt muss ich noch Doppelte oder n =
mal
> nacheinander kommende Bindestriche finden, nicht jedoch bla-bla-bla sonde=
rn
> nur bla--bla oder bla---bla. Ich habs mit -* und -+ versucht, funktioniert
> aber nicht da es mir dann auch bla-bla-bla filtert. Kann mir jemand
> weiterhelfen?
Das ist ein Fall fuer "gierige" und weniger "gierige" Expressions. Ohne
Witz, schau mal nach regex und gierig bzw. greedy.
BTW: Du wirst einige Domains ausschliessen, wenn Du nich mal zwei
Bindestriche zulaesst;-)
regards
Julian