tweepyの導入とpython対話型コンソール上での操作(1)

準備済だったこと

www.slideshare.net

 

上記slideshareを参考にpython3.5のインストール

pipはデフォルトで同時にインストールされる

環境変数にC:/Users/userを追加

sublimeのインストールおよび日本語化

 

 

最初にやったこと

statsbeginner.hatenablog.com

ここを参考にtweepyのインストール

Twitter開発者ページから各種キーを取得

例にあるのと同じ方法でimport用pyファイルの作成

 

対話型コンソールでのテストの前準備

対話型コンソールの起動

python

>>>

 作成したimport用pyファイルのimport

>>>import twpy

apiオブジェクトを得る

>>>api = twpy.api

 

tweepyを用いてAPIを通してTwitterにアクセスするテスト

現在の自分のTLの最新のTweetのTextを表示する

>>>print (api.home_timeline()[0].text)

本日は曇天なり。

 

対象のユーザー(@hoge)の投稿を100件取得し、オブジェクトに格納する(最大200件、それ以上は強制的に200件にされる)

>>>hogetl=api.user_timeline('hoge', count=100)

api.user_timelineに関してはこちらが詳しい(tweepyが対応しているかどうかは不明)

syncer.jp

hogetlに取得した投稿は様々な属性に分けられて格納されている

>>>print(hogetl[0].id)

315159265358979323

>>>print(hogetl[0])

最後のはすべての情報が表示される。とてつもなく多い。

取得可能な属性を知りたい場合は以下のように入力すると羅列される。Tweetによってあるものとないものがある模様。

>>>dir(hogetl[0])

['__class__', '_delattr__', ... 'user']

 

 

次にやること

画像付きURLを見分けるのは

>>>hogetl[i].entities

の中にあるtype='photo'でいいだろうか?それをもっとスマートに取り出すことはできるか?

 

JSONを使用して保存・解析ができるか?