絵師さんのTweetをRTするbotについて(5) - フィルタリングと個別TL掘削

ノイズ除去の方法

実装済の機能は以下のとおり。

  • フォローしているユーザーがRTしたものは除去する
  • RT数とふぁぼ数で閾値を設け、閾値に達しないものは保留扱いとする。保留扱いのTweetは次のbot実行時にシャッフルして再度評価し直す。

これでずいぶんノイズは除去されたと思われる。

 

ユーザー個別のTLの掘削

実装済の機能は以下のとおり。

  • フォローしているユーザーそれぞれについて最新既読Tweetと探索回数を割り振る(デフォルトはどちらも0)
  •  探索回数の少ないユーザーからTLを最新既読Tweetまで取得可能なだけ取得する(最大3200件)
  • 通常通りのアルゴリズムで画像付きTweetをRT候補リストに追加する

この機能はAPI制限の関係で一度のループでかなり人数をしぼる必要がある。