2016-07-16 絵師さんのTweetをRTするbotについて(5) - フィルタリングと個別TL掘削 ノイズ除去の方法 実装済の機能は以下のとおり。 フォローしているユーザーがRTしたものは除去する RT数とふぁぼ数で閾値を設け、閾値に達しないものは保留扱いとする。保留扱いのTweetは次のbot実行時にシャッフルして再度評価し直す。 これでずいぶんノイズは除去されたと思われる。 ユーザー個別のTLの掘削 実装済の機能は以下のとおり。 フォローしているユーザーそれぞれについて最新既読Tweetと探索回数を割り振る(デフォルトはどちらも0) 探索回数の少ないユーザーからTLを最新既読Tweetまで取得可能なだけ取得する(最大3200件) 通常通りのアルゴリズムで画像付きTweetをRT候補リストに追加する この機能はAPI制限の関係で一度のループでかなり人数をしぼる必要がある。