絵師さんのTweetをRTするbotについて(4) - 6時間程度のテスト実行後の課題
RT対象となるTweetの数
自分のタイムラインにはフォローしているユーザーのTweetおよびそのユーザーがRTしたTweetが流れてくる。RTされたTweetを除去している現在の環境では、500名程度のフォローでは休日昼間の巡航運転時(画像付きTweetの投稿はかなり多めと思われる)画像付きTweetの流入数は流出数を下回る。フォロー数の増加、およびユーザーのタイムラインを掘ることで画像付きTweetの流入を増やすことが今後の課題。
ノイズ除去
ユーザー自らが投稿した画像付きTweetの中にもノイズがかなり見られる。多く見られるものでできれば除去したいものとしては以下のものがある。
- 食事や動物・風景などの写真
- ゲームなどのスクリーンショット
人によって多いもので、きわどいものには以下のものがある。
- 宣伝用の商品の写真やスクリーンショットのうち機械的に繰り返し投稿されているもの
これらを除去するために現在利用可能な指標を用いたスクリーニングが簡単に思いつく。たとえばファボ数やRT数を見て、閾値に達していない場合は即座にRT対象のTweetリストに追加するのではなく、スクリーニング落ちリストに追加する。後にスクリーニング落ちリストの再評価を行い、閾値を超えたものは改めてRT対象のTweetリストに追加する。