keskiviikkona, maaliskuuta 27, 2019

Spämmianalyysia

Tämän blogin kommentoinnissa ei ole mitään muita spämmiestoja kuin se, että kahta viikkoa vanhempiin postauksiin tulevat kommentit menevät automaattisesti hyväksynnän kautta. (Niin, anteeksi te kaikki joiden kommentit ovat lojuneet ehkä viikkojakin julkaisematta! Olen kyllä huomannut ne sähköpostissani, mutten välttämättä aina tajunnut, että tämä pitää käydäkin hyväksymässä että se näkyy.) Tästä huolimatta blogikommentteihin tulee minkäänlaista spämmiä vain aniharvoin. Lisäksi Googlen omat roskapostifiltterit blokkaavat näistä vielä ylivoimaisesti suurimman osan.


© Pixabay

Nyt on taas ollut menossa jonkinlainen spämmikausi tai ehkä syynä on englanninkielinen otsikko (Horse Reality), joka saattaa näyttää paremmalta kohteelta spämmiboteille kuin nämä muut. Ja siis spämmikaudella tarkoitan sitä että välillä 11.-24.3. tuli tuohon yhteen postaukseen peräti kymmenkunta spämmikommenttia, kun koko viime vuoden saldo oli 7. Toivon kuitenkin ettei trendi ole jatkuva, sillä vaikka spämmi ei aiheutakaan ongelmia tällä hetkellä, siitä voi tulla ongelma jos määrä paisuu kovasti.

Uskoisin kuitenkin että tämä on tilapäistä, koska loppuvuonna blogi koki vähän samankaltaisen "aallon": ikivanha postaus Suvun vaikutus laukkahevosilla keräsi joulun alla kahden päivän sisällä 4 spämmikommenttia. Sitten se loppui, yhtä yhtäkkisesti kuin oli alkanutkin. Tai ei sitä ehkä yhtäkkisesti alkaneeksi voi sanoa, tähän postaukseen oli tullut jo yksi spämmi kesällä 2018. Sitä en ymmärrä, mikä tässä nimenomaisessa postauksessa on trigannut spämmibotteja kymmenen vuotta postauksen ilmestymisen jälkeen.

Selasin tässä vähän läpi noita vanhoja blogin roskaposteja, nehän näkyvät Bloggerissa omassa roskaposti-kansiossaan, ellei niitä mene poistamaan. Ja minähän en koskaan poista mitään, joten kansiosta löytyy oletettavasti kaikki blogiin tullut spämmi vuodesta 2012 alkaen. Tällainen pidempi aika ja jonkinlainen määrä (250 spämmikommenttia) tarjoaa jonkinlaista perspektiiviä asiaan, joten tässä minun havaintoja viimeisen 7 vuoden ajalta.

Spämmi voidaan jakaa nähdäkseni 5 eri tyyppiin:
– Näennäiskommentit
– Näennäiskommentit mainoslinkeillä
– Random-tekstit, mainoslinkeillä tai ilman
– Pelkät mainoslinkit
– Sekasotkut

Näennäiskommentit ovat olevinaan ihan relevantteja kommentteja blogitekstiin eikä niissä ole linkkejä millekään toisille sivustoille (kommentoijan profiili voi viedä jonnekin, mutta niitä en näe Bloggerissa), joten minulle on aina ollut vähän mysteeri, että mitä näillä oikein ajetaan takaa. Ei näitä kyllä kukaan pysty oikeiksi kommenteiksi luulemaan, koska kommentit ovat vieraskielisiä, yleensä englantia, mutta vaihtelee. Lisäksi kommentit ovat hyvin geneerisiä, sellaisia joita voi lätkiä ihan mihin tahansa postaukseen, se ei siis mitenkään spesifioi juuri sitä kyseistä postausta. Yleensä niissä kehutaan ja kiitellään postausta, tyyliin "Vau, oletpa analysoinut aihetta tosi perusteellisesti, on mielenkiintoinen teksti".

Näennäiskommentit mainoslinkeillä ovat samanlaisia kuin pelkät näennäiskommentit, mutta sinne sekaan on ujutettu linkkejä, jotka vievät epämääräisille sivuille. Ei kannata klikata.

Random-tekstit ovat juuri sitä mitä nimi sanoo: random-tekstejä. Ne eivät yritä liittyä blogiin tai postaukseen edes sitä vähää kuin näennäiskommentit. Tällainen on esimerkiksi yksi viimeisimmistä spämmeistä tuohon Horse Reality -postaukseen: "Whole revenue rose 13 percent to $250.9 million, but fell short of analysts' estimate of $254.5 million." Kuten näkee, tällä ei ole mitään tekemistä minkään kanssa. Joskus näissä on mainoslinkkejä saiteille, jotka eivät liity mitenkään tekstin aiheeseen.

Tunnetuin tyyppi lienee erilaiset mainoslinkit, joskus mukana on tekstiäkin jossa kerrotaan mitä kaikkea on tarjolla (yleensä joko jotain aikuisviihteeseen liittyvää tai sitten lääkkeitä/huumeita), joskus vain pelkkä linkki joka ei kerro mitään mihin se vie. Ja näitähän tulee sitten "parhaassa" tapauksessa ihan joka kielellä, toisinaan myös ihan sekasotkuja.
Tämän spämmityypin määrä on vähentynyt varsin radikaalisti täällä meidän blogissa, vuosina 2012-16 suurin osa blogispämmistä oli juurikin näitä, vuonna 2017 oli yksi yhden päivän aalto, jolloin vanhaan postaukseen tuli nopeassa tahdissa useampi kymmenen "Tilaa Viagraa" -linkkiä. Sen jälkeen niitä ei olekaan juuri näkynyt. En tiedä onko Bloggeriin tehty suoraan jokin esto, näissä nimittäin oli lähes poikkeuksetta linkki-täginä hakasulkeet [url=...], joka ei Bloggerissa toimi lainkaan. Tällainen merkkijono olisi helppo blokata suoraan, jolloin spämmikommentit eivät tulisi läpi lainkaan.

Sekasotku on sitten linkitön kommentti, joka ei ole mitään tunnistettavaa kieltä edes tai ainakaan varsinaisesti mitään järkeenkäypiä lauseita. Jotkut ovat melko selkeitä injektiohyökkäyksen yrityksiä tai jotakin vastaavaa, jotkut sitten taas... ei pysty ymmärtämään.

– S

*Lisäys 10.5.19*
Blogiin on nyt lisätty varmistus bottien varalta, koska tuo Horse Reality -postaus alkoi kerätä spämmikommentteja enemmänkin. No, se loppui nyt.

Ei kommentteja: