Das grosse RegEx Alphabet

Antwort erstellen

Bestätigungscode
Gib den Code genau so ein, wie du ihn siehst; Groß- und Kleinschreibung wird nicht unterschieden.
Smilies
:D :) :( :o :shock: :? 8) :lol: :x :P :oops: :cry: :evil: :twisted: :roll: :wink: :!: :?: :idea: :arrow: :| :mrgreen:
BBCode ist eingeschaltet
[img] ist eingeschaltet
[flash] ist ausgeschaltet
[url] ist eingeschaltet
Smilies sind eingeschaltet
Die letzten Beiträge des Themas
   

Ansicht erweitern Die letzten Beiträge des Themas: Das grosse RegEx Alphabet

Re: Das grosse RegEx Alphabet

Beitrag von Quellcore » 16. Apr 2010, 22:13

Hi Andreas_Z,

Vielen Dank erst einmal für das Stöbern im Papierkorb.
So.. ist schwer was zu finden. Solche verunstaltungen werden immer seltener bei mir.

Interessanterweise scheint das bei mir auch so, diese Masche ist wohl nicht mehr aktuell, oder besser gesagt zur Zeit.
Ich habe aber gefunden:
Code: Alles auswählen
l -> I

aber vermutlich hast Du das schon drin nur eben vertippt. Bei Dir steht statt eines großen "i" ein kleines "L".

Grundsätzlich ist die Boost RegEx-DLL in Spamihilator unempfindlich in Bezug auf die Groß- und Kleinschreibung ("Case Insensitive").
Das das kleine "i" schon drin ist, haben wir diesen Fall also abgedeckt.
Das kleine "l" (wie in "Ball") taucht nur einmal in der Auflistung auf, beim scheinbar zweiten Mal ist es aber eine Eins.
Dann wäre da noch:
Code: Alles auswählen
o -> 0 eventuell auch(OöÖQD)


Guter Ansatz, beim Wegstreichen der Groß- und Kleinschreibung bleibt dann noch:
Für "o" wie in Otto kann man folgende Alternativen finden:
Null "0"
"ö" wie in "hören"
"q" wie in "quellcore"
"d" wie in "David"

Summa Summarum:
Code: Alles auswählen
o -> [oöqd]


Gruß,
Quellcore

Re: Das grosse RegEx Alphabet

Beitrag von Andreas_Z » 16. Apr 2010, 07:51

Hallo Quellcore!

So.. ist schwer was zu finden. Solche verunstaltungen werden immer seltener bei mir. Ich habe aber gefunden:

Code: Alles auswählen
l -> I


aber vermutlich hast Du das schon drin nur eben vertippt. Bei Dir steht statt eines großen "i" ein kleines "L". Dann wäre da noch:
Code: Alles auswählen
o -> 0 eventuell auch(OöÖQD)


Gruß
Andreas_Z

Re: Das grosse RegEx Alphabet

Beitrag von Chactory » 17. Mär 2010, 10:39

Hallo zusammen!

Interessant an dieser Übersicht ist übrigens auch, daß bestimmte Buchstaben gerade nicht variiert werden können.

Gruß, Chactory

Re: Das grosse RegEx Alphabet

Beitrag von Andreas_Z » 17. Mär 2010, 10:30

Hallo Quellcore!

Quellcore hat geschrieben:Erfahrung brauchst Du doch auch gar nicht, vielleicht könntest Du ja mal in Deinem Spami-Papierkorb stöbern und ein paar Buchstabenverwechslungen bzw. Vertauschungen heraussuchen.
Beim "b" faellt mir gerade nichts ein, fürs "c" wiederum gibt doch einige, ich habe den Eroeffnungspost mal dementsprechend geupdated.

Das mach ich glatt. Wenn ich was finde, werde ich es posten.


Gruß
Andreas_Z

Re: Das grosse RegEx Alphabet

Beitrag von Chactory » 17. Mär 2010, 00:19

Hallo Quellcore!

Vielen Dank! :)

Gruß, Chactory

Re: Das grosse RegEx Alphabet

Beitrag von Quellcore » 16. Mär 2010, 23:46

Hallo Chactory!
Danke für Dein Input, wird sofort eingetragen.

Im übrigen habe ich Deinen Kommentar zur Gefahr der False-Positives durchaus ernst genommen, manchmal ist weniger mehr, und man sollte nicht immer versuchen, alle Varianten zu erkennen.
Ich habe in einem anderen Thread ja auch schon mal erläutert, dass ich mich auch lieber von der spezifischen Seite annähere und die RegEx dann ggf. verallgemeinere/unschärfer mache, wenn es dann die Situation erfordert.
Das hat bei mir aber auch schon zu Frustration geführt:
Da bastelt man so vor sich hin, um dann beim nächsten Abholvorgang die Früchte seiner frisch erstellten RegEx bestaunen zu dürfen, muss dann aber leider feststellen, das sich die Chaoten wieder eine andere Abart haben einfallen lassen, so dass die frisch erstellte RegeX so nicht greift und wieder angepasst werden muss.


Gruß
Quellcore

Re: Das grosse RegEx Alphabet

Beitrag von Chactory » 16. Mär 2010, 22:11

Hallo zusammen!

Nur zu! Ich wollte Eure Euphorie auf keinen Fall bremsen! :)

Hmm ... für b vielleicht noch 8, für e €, für i :, für l 7 oder |, für s auch z und umgekehrt, für u auch v ...

Gruß, Chactory

Re: Das grosse RegEx Alphabet

Beitrag von anbuva » 16. Mär 2010, 18:43

Hallo Quellcore!

da ich ja nun auch kein großer Experte, dafür aber interessierter User bin, halte ich die Liste trotz Chactorys nachvollziehbarer Bedenken doch für hilfreich. Die Gefahr einer Fehlfilterung ist ja (fast) immer gegeben und die Praxis wird es ja zeigen :wink:

Gruß
anbuva

Re: Das grosse RegEx Alphabet

Beitrag von Quellcore » 16. Mär 2010, 04:38

Chactory hat geschrieben:...aber nicht ganz unkritisch, denn bei manchen Suchbegriffen erleidet man mit falsch-positiven Filterungen Schiffbruch, wenn man alle möglichen Varianten verwendet ...

Das sollte man natürlich immer im Hinterkopf behalten, definitiv eine Gefahr jeder "RegEx(p)?" :lol:
In vielen Fällen kann man aber durch Gegenmaßnahmen auch wiederum viele Probleme verhindern, wenn man etwas tiefer in der RegEx-Trickkiste greift.
Andreas_Z hat geschrieben:Leider kann ich nicht viel Beisteuern. Meine RegExp-Erfahrungen sind nicht so groß.

Erfahrung brauchst Du doch auch gar nicht, vielleicht könntest Du ja mal in Deinem Spami-Papierkorb stöbern und ein paar Buchstabenverwechslungen bzw. Vertauschungen heraussuchen.
Beim "b" faellt mir gerade nichts ein, fürs "c" wiederum gibt doch einige, ich habe den Eroeffnungspost mal dementsprechend geupdated.

Gruss,
Quellcore

Re: Das grosse RegEx Alphabet

Beitrag von Andreas_Z » 15. Mär 2010, 18:14

Hallo Quellcore!

eine gute Idee. Leider kann ich nicht viel Beisteuern. Meine RegExp-Erfahrungen sind nicht so groß.

Gruß
Andreas_Z

Re: Das grosse RegEx Alphabet

Beitrag von Chactory » 15. Mär 2010, 10:28

Hallo Quellcore!

Gute Idee, aber nicht ganz unkritisch, denn bei manchen Suchbegriffen erleidet man mit falsch-positiven Filterungen Schiffbruch, wenn man alle möglichen Varianten verwendet ...

Gruß, Chactory

Das grosse RegEx Alphabet

Beitrag von Quellcore » 15. Mär 2010, 05:15

Guten Tag meine sehr verehrten Freunde und Freundinnen der Regulären Ausdrücke.
Viele RegEx Regeln ließen sich relativ schnell zusammenklicken, wenn man einmal ein Grundalphabet für alle Buchstaben (bzw. Zeichen aller Art) und deren Maskierungen erstellt hat.
Ein Art Nachschlagewerk im Stile der Langenscheidt Woerterbuecher, "Buchstabe <-> RexEx"

Code: Alles auswählen
a -> (a|@|/\\|4)
b -> [b8]
c -> [c\(\{\[]
d ->
e -> [e3€]
f ->
g ->
h -> (h|\]\[)
i -> [il1!:;'\|]
j ->
k ->
l -> [li17!\|]
m ->
n ->
o -> [oöqd]
p -> [pqg]
q -> [pqg9]
r ->
s -> [sz]
t ->
u ->
w ->
x ->
y ->
z -> [zs]


...und natürlich auch mein Favorit
Code: Alles auswählen
SPACE bzw. Leer-/Füll-/Trennzeichen -> [\W\s_]


Was haltet ihr davon, diese Liste mal zu komplettieren :?:

Gruß,
Quellcore

Nach oben

 industrious-southeast