ブロックリストのあとに
フィッシング対策を
もう1段階増やす方法の提案

DEMO-25 @ CSS 2024

分類器の訓練に使用したデータセット

フィッシングページ 正規ページ
情報収集元 X (旧Twitter) に投稿されていた
フィッシングURL情報
Tranco listの上位250ドメイン名に
関連するログインページ
収集期間 2023/03/16 - 2024/05/29 2024/09/05 - 2024/09/06
収集数 1391ページ 120ページ

使用した特徴量

  1. scriptタグ数
  2. 内部リンク中の相対リンクの割合
  3. Google Analyticsの利用有無
  4. headタグ内のタグ数
  5. 外部リンク (閲覧中WebページとeTLD+1が違うリンク) の割合
  6. 同一リンクの最大数
  7. iframeタグ数
  8. 画面遷移しない「規約」「プライバシーポリシー」リンクの有無
  9. 別のWebページをコピーした痕跡の有無
  10. ページタイトルの有無
  11. IPアドレスが含まれるリンクの有無

各特徴量の詳細

scriptタグ数

最大値 / 個 最小値 / 個 平均値 / 個 中央値 / 個
フィッシングページ 188 0 4.59 3
正規ページ 152 0 26.4 20.5
scriptの 削除/追加 パターンの分析
フィッシングページ数が多い上位5ブランドを調査

  • 全てのscriptタグを削除
  • 全てのscriptタグを削除し、何らかの難読化されたscriptを追加
  • JQuery以外のscriptを削除し、訪問者のIPアドレス取得が目的と推定されるscriptを追加
  • JQuery以外のscriptを削除し、訪問者のIPアドレス取得が目的と推定されるscript、定期的にサーバと通信するscriptを追加
  • 特定のリンクを除き、aタグの全てのリンクを"#"に置き換え
  • コピーライトの年数生成scriptを除き、すべて削除
  • JQueryとフォームのバリデーション以外のscriptを削除

内部リンク中の相対リンクの割合

最大値 / % 最小値 / % 平均値 / % 中央値 / %
フィッシングページ 100 0 98.6 100
正規ページ 100 0 49.6 50

Google Analyticsの利用有無

フィッシングページ 正規ページ
Google Analyticsが
使用されていたページ数
7 (0.50%) 40 (33.3%)

headタグ内のタグ数

最大値 / 個 最小値 / 個 平均値 / 個 中央値 / 個
フィッシングページ 124 3 13 16.5
正規ページ 276 2 33.5 47.9

外部リンク (閲覧中WebページとeTLD+1が違うリンク) の割合

最大値 / % 最小値 / % 平均値 / % 中央値 / %
フィッシングページ 100 0 59.8 91.5
正規ページ 85.7 0 13.8 6.67

同一リンクの最大数

最大値 / 個 最小値 / 個 平均値 / 個 中央値 / 個
フィッシングページ 10 2 1.83 0
正規ページ 10 0 2.00 2

iframeタグ数

最大値 / 個 最小値 / 個 平均値 / 個 中央値 / 個
フィッシングページ 7 0 0.52 0
正規ページ 15 0 1.98 1

画面遷移しない「規約」 「プライバシーポリシー」リンクの有無

フィッシングページ 正規ページ
「規約」 「プライバシーポリシー」
リンクがあったページ数
1000 (71.8%) 37 (31.4%)
画面遷移しないリンクがあったページ数 165 (16.5%) 1 (2.7%)

別のWebページをコピーした痕跡の有無

フィッシングページ 正規ページ
コピーの痕跡があったページ数 375 (27.0%) 0 (0%)

ページタイトルの有無

フィッシングページ 正規ページ
titleタグがないページ数 92 (6.6%) 0 (0%)
titleタグの中身が
空文字列だったページ数
38 (2.7%) 0 (0%)
合計 130 (9.3%) 0 (0%)

IPアドレスが含まれるリンクの有無

フィッシングページ 正規ページ
IPアドレスが含まれるリンクがあるページ数 75 (5.4%) 0 (0%)