かなり撃退できました。

著者: momokuri Eメール

リンク: http://blogs.da-cha.jp/momokuri.php/2006/05/21/b2evolutiona_ra_sa_a_na_e_cac_e_fa_enhan#c4557

本サイトでも活用しているSpamDeluxe機能を強化して、閾値以上のトラックバック・コメントが来た場合には、コメントを自動的にdeprecatedにフラグ付けし、スパムの可能性のあるドメインとして管理した上で、最近のコメント一覧への表示をしない、というロジックにしました。

エセキャプチャ機能、ポテンシャルスパマー自動検出機能、自動deprecate機能の組合せで、この1週間にくるコメントスパム・トラックバックスパム・abuseのうち、10件程度がすり抜けただけで、対処できました。

大垣さんのところでは2500件もきて、大変そうですが。

...

この10件ですが、

  1. BLOGのスパムに対する耐性をロボットがチェックするための、keywordのみのtrackback打ち込み
  2. affilicateで商売しているサイトのSEO対策?と思われる広告だけのtrackback
  3. 1、2件だけのabuse trackback

になります。
ひとつめの手法は、WikiPediaの解説 Spamdexingや、Comment spam number mysteryがとても参考になります。

今後の対処ですが、コメントスパムナンバー対策として、latinで単語として意味を成さない語句を検出、potential spamming keywordとしてDBにて蓄積して、閾値判定するロジックを入れたいと思います。閾値判定はすでに実装済みですから、スパムナンバーをどうやって検出するか、というのが技術的課題です。
そのほかには、comment key機能の実装です。

この記事へのトラックバック アドレス

トラックバック URL (右をクリックし、ショートカット/リンクをコピーして下さい)

1 コメント

コメント from: momokuri [メンバー] Eメール
momokuriもうひとつありました。
記事を入力可能なメンバーが投入したURLについて、現在はコメントと同様にPotential SPAMの候補になってしまうのを、対象外にする、というのもあります。
始めから、authorisedに入れてしまうという考えもありますが、たとえばだれでも会員になれるようなblogサイト運営をしているケースを考えると、会員になって記事にblogspamのURLを投入することでwhitelistに登録できることになり、よくありません。
2006/07/15 @ 15:16

コメントを残す


頂いたEメールアドレスはこのサイト上には表示されません

頂いたURLは表示されます。
(改行が自動で <br /> になります)
(名前、Eメールとウエブサイト)
(ユーザに、メッセージ・フォームを通じた連絡を許可します (あなたのEメール・アドレスは表示されません))