Hallo Susi,
bei mir schaut es anders aus. Ich habe die Mails mehrfach im Trainingsbereich. Jedoch is eine zweite Mail (auch mehrfach) nur im Papierkorb, nicht jedoch im Trainingsbereich.
Trotzdem danke für den Tip.
Gruß
Tom
Moderator: Forum-Team

Susi hat geschrieben:Tom hat geschrieben:Hab da einige Mails, mit solch kryptischen Inhalt. Ich denke, die tauchen alle nicht im Traingsbereich auf. Vielleicht liegts ja daran.
Habe auch schon beobachtet, dass Mails im Papierkorb, aber nicht im Trainingsbereich stehen. Das waren in der Regel Mails mit identischem Inhalt (Dubletten), aber unterschiedlichem Absender. Ist schon vorgekommen, dass eine Spam-Mail bis zu fünfmal einging. Irgendwo hat mal jemand im Forum erklärt, Dubletten würden nicht im Trainingsbereich erscheinen. Vielleicht liegt's daran?
Gruss von
Susi

S3bast1an hat geschrieben:Florian machte mich im Forum auf einen Fehler aufmerksam durch den in der Beta_v04 "FakeURLs" aller http://www.microsoft.de@spamerspage.com nicht richig erkannt wurden. Das Problem ist jetzt hoffentlich behoben..vielleicht achtet ihr auch noch einmal darauf ...

Susi hat geschrieben:Hallo S3bast1an,
könntest Du bitte nochmal erklären, was beim Übergang von Beta 4 zu Beta 5 passiert ist? In der Mail hiess es...S3bast1an hat geschrieben:Florian machte mich im Forum auf einen Fehler aufmerksam durch den in der Beta_v04 "FakeURLs" aller http://www.microsoft.de@spamerspage.com nicht richig erkannt wurden. Das Problem ist jetzt hoffentlich behoben..vielleicht achtet ihr auch noch einmal darauf ...
Mir fällt nur eins auf: Nehmen wir mal den folgenden LOG-Auszug...
src=3D"http://www.buoy.com@%69%6Da%67%65s%32.%6C%61i%68%2Eco%6D
/c%72%65at%69%76es/%64r%65%61ms%68%61p%65/TopLogo_04.gif"
width=3D"98"
height=3D"42" href=3D"http://www.nude.com@%69pr%6F%78y.%6Caih.
%63%6F%6D/ip%72o%78%79/A/%70.%6Ca%69%68.%63%6F%
6D/redir.cfm?ccode=3D7895B36E&pcode=3DA160A3F4" target=3D
Folgende URLs gefunden:
%69%6da%67%65s%32.%6c%61i%68%2eco%6d
%69pr%6F%78y.%6caih.%63%6F%6d
Der Filter scheint jetzt die rot markierten URLs irgendwie zu übergehen. Sie werden laut LOG nicht mehr gefunden und tauchen auch in all_urls nicht mehr auf. Auch der URL-Extractor holt sie nicht heraus. Erkannt wird offenbar nur noch, was auf diese URLs zwischen @ und / folgt (blau markiert).
Ist das so? Und wenn ja, was ist der Sinn dieser Änderung? Gehen da nicht manche Spam-URLs verloren?


Susi hat geschrieben:Ansonsten scheint mir die Sache seit S3bast1ans improlearn.exe praktisch perfekt zu sein. Der Filter erkennt bei mir inzwischen um die 80 - 90% des Spams. Davor hatte ich aus dem Papierkorb immer noch die eine oder andere Spam-URL herausgequetscht, indem ich den Ordner \recycle mit Agent Ransack (http://www.agentransack.com) durchforstete (gute Freeware! beherrscht Regular Expressions und zeigt die Fundstellen im Kontext an). Aber seit improlearn.exe kann ich mir das sparen - es kommt kaum noch Zusätzliches heraus.
Susi hat geschrieben:Einzige Sorge: Neuerdings stürzt Spami gelegentlich beim Mail-Abruf oder auch mal beim Training total ab. Mal sehen, ob sich das stabilisiert. Könnte evtl daran liegen, dass ich die riesige Reisekäfer-blacklist zum Teil importiert habe und mein altes Notebook (Win 98, 233 MHz, 96 MB RAM) unter 3.000 Spam-URLs in die Knie geht? Womit ich beim nächsten Thema wäre...
Susi hat geschrieben:Das einzige, was mir im Moment noch verbesserungsbedürftig erscheint, das ist diese Basis-blacklist auf reisekaefer.de. Habe schon diverse Anmerkungen zu diesen Listen gemacht und will das nicht wiederholen. Wichtiger als jeder Versuch, diese Liste zu verbessern, erscheint mir eins: Wir sollten jetzt mal drangehen, eine taufrische, erfolgskontrollierte neue Basis-blacklist zu erstellen, indem wir unsere black_success.txt zusammenführen. Wäre das nicht mal was?

Susi hat geschrieben:Neuerdings stürzt Spami gelegentlich beim Mail-Abruf oder auch mal beim Training total ab...
... Das einzige, was mir im Moment noch verbesserungsbedürftig erscheint, das ist diese Basis-blacklist auf reisekaefer.de.


Florian hat geschrieben:Noch ein Nachtrag zu den Abstürzen (gerade ist es wieder passiert): Es liegt wohl doch nicht an der Menge der Emails im Trainingsbereich. Ich denke es sind eher bestimmte Emails, die den Absturz verursachen. Wenn ich nach dem Absturz den Trainingsbereich neu aufmache, sehe ich, dass Spami ein paar Emails abgearbeitet hat bevor es abgestürzt ist. Lösche ich die oberste Email in der Trainingsliste und lasse dann wieder trainieren, läuft es ohne Absturz. Lösche ich die Mail nicht, stürzt Spami beim Training wieder ab.
Ich hatte mir vorhin vor dem Absturz gerade das URL-Log angesehen und mir war aufgefallen, das in der "Trainingskillermail" eine URL sehr oft wiederholt vorkam (ca. 20 mal). Vielleicht liegt es daran?
Florian

S3bast1an hat geschrieben:Florian machte mich im Forum auf einen Fehler aufmerksam durch den in der Beta_v04 "FakeURLs" aller http://www.microsoft.de@spamerspage.com nicht richig erkannt wurden. Das Problem ist jetzt hoffentlich behoben..vielleicht achtet ihr auch noch einmal darauf ...

Florian hat geschrieben:Verify this ulr at this moment for your additional benefit!
http://freeinternationalsex.com:freeinf ... a/?q=kHNzk


Susi hat geschrieben:Wenn ich nun die 22 Varianten lösche und nur noch medsforcheap.biz auf die blacklist setze, dann reicht das völlig aus. Künftig wird jede nur denkbare Variante ausgefiltert.
Das nützt jedoch nicht viel. Denn der Filter hört nicht auf, alle Varianten weiterhin als neue URL zu erfassen. Könnte man ihm das nicht abgewöhnen? Die Vorgabe wäre: Behandle eine URL auch dann wie eine bereits bekannte URL, wenn in ihr eine bekannte URL nur als Substring enthalten ist. Wäre das nicht rationeller?

S3bast1an hat geschrieben:ja, ja ... der boese Doppelpunkt ... aber ich weiss jetzt auch nicht wie ich das hinbekommen soll, denn ne URL kann doch eigentlich garkeinen Doppelpunkt enthalten ... und ergo erkennt der Filter das als den Schluss einer URL
Susi hat geschrieben:Hallo S3bast1an,
die Beta 6 läuft einwandfrei. Bislang keine Abstürze.

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast