個人ブログのようなものです。とくにジャンルはありません。
広告枠
記事の概要
作成日:2021-10-31
最終更新日:2021-10-31
記事の文字数:3485
情報技術情報技術-WebAPIWebサイト作成
管理人作品宣伝
【アークナイツ】アークナイツ-必要素材数集計ツール
Webサイト / 最終更新:2022-06-12
『アークナイツ』の育成状況を記録し、育成に必要な素材数を集計するページです。オペレータ…
HPで閲覧する
利用素材等の詳細情報
【アークナイツ】先鋒だけで保全駐在
動画 / 最終更新:2024-11-24
先鋒縛りで保全駐在をやっていく動画です。…
YouTubeで閲覧するニコニコ動画で閲覧する
利用素材等の詳細情報
作品一覧はこちら
Pythonを使ってFeedlyでサイトの更新情報を取得してみた
Feedlyが公開しているWeb APIを使用して、Pythonで自動的にサイトの更新情報を取得できるようにした。
ので実際のPythonコードを交えてそのやり方のメモをここに残します。
ちなみにコードを書くのは上手くないのでクオリティには目をつぶってください。
前提
  • Feedlyは無料サービスを使用する(有料でどう変わるかがわからなかったため)
  • アクセストークン(30日間有効)は手動更新とする(無料では自動更新ができないため)
ざっくりとした流れ
大体の作業の流れは以下の通りです。 このうちpythonで自動化するのは「4~5」デス。
  1. Feedlyにサービス登録する
  2. Feedlyに更新をウォッチしたいサイトを登録する
  3. Feedlyでアクセストークンを発行する
  4. 【python】サイトの更新情報を取得する
  5. 【python】取得した情報をテキストファイルに保存する
実作業
1.Feedlyにサービス登録する
まず最初に、当然ですがFeedlyでアカウントを登録する必要があります。
以下に記事があったのでこちらの手順に従えばできるかと思います。
アカウント登録手順
2.Feedlyに更新をウォッチしたいサイトを登録する
Feedlyでアカウントを登録したら、最初に更新をウォッチしたいサイトを登録する必要があります。
以下の画像の場所から登録できます。
画像クリックで等倍
ウマ娘関連のサイトがいっぱい並んでます。
3.Feedlyでアクセストークンを発行する
APIを利用する上でアクセストークン(APIを利用するために必要なログイン情報)が必要です。
以下のURLから発行できるはずです。
アクセストークン発行ページ OAuthという認証方法を利用しているようですが、無料版ではアクセストークンを画面上でしか取得できないようで、更新(再発行)も画面上のみなので、 アクセストークンが切れる前に画面上で再度アクセストークンを発行し直す必要があります。
アクセストークンの有効期限は30日のようです。
有料版ではリフレッシュトークンを使用して、アクセストークンを再取得できるようです。
4.【python】サイトの更新情報を取得する
ここからpythonコードになります。どうでもいいところは中略です。
# パッケージの読み込み import requests ~~~中略~~~ #------------------------------------------------------------------- # 記事取得 def getArticle(streamId): ret = "" try: # コールアウトに必要な情報を格納 url = "https://cloud.feedly.com/v3/streams/contents?streamId=" + streamId + "&count=" + artNum access_token = "Bearer " + CommonFunction.getFileContent(trgtFolder + "AccessToken.txt") reqHeader = { "Content-Type":"application/json", "Authorization":access_token } res = requests.get(url, headers=reqHeader) js = res.json() for article in js["items"]: # ここで見たい情報をまとめる ret += article["title"] except: CommonFunction.updFileContent(trgtFolder + "エラー.txt", "ステータスコード:" + str(res.status_code)) return ret #-------------------------------------------------------------------
記事本体を取得するためのメソッド「getArticle(streamId)」です。
WebAPIを叩くためにあらかじめ「requests」パッケージをインポートしておく必要があります。
コードについて重要なところをかいつまんで解説します。
url = "https://cloud.feedly.com/v3/streams/contents?streamId=" + streamId + "&count=" + artNum
WebAPIのエンドポイントURLです。
「streamId」というウォッチしたいサイトごとのIDのようなものをパラメータに付与する必要があります。詳細は後述します。
countを指定することで一つのサイトごとに何個の記事を取得するかを指定できます。
access_token = "Bearer " + CommonFunction.getFileContent(trgtFolder + "AccessToken.txt")
ひとつ前の手順で作成したアクセストークンをここで定義します。
独自関数を使用していますが、単にテキストファイルの中に直接書いておいたアクセストークンを取得しているだけです。
アクセストークンの前に「Bearer 」をつけるのを忘れないようにしましょう。
reqHeader = { "Content-Type":"application/json", "Authorization":access_token }
WebAPIを叩くときのHTTPリクエストヘッダーです。
「Authorization」にアクセストークンを付けます。
アクセストークンの前に「Bearer 」をつけるのを忘れないようにしましょう(再掲)。
res = requests.get(url, headers=reqHeader) js = res.json()
リクエストに必要なのはエンドポイントURLとリクエストヘッダーだけです。
正常に取得できるとjson形式でレスポンスが来るので、json()メソッドを使って辞書型(MAP型)で受け取ると楽です。
正常に取得できなかった場合にはjson形式でないはずなので、気になる人は例外処理しましょう。
res = requests.get(url, headers=reqHeader) js = res.json()
for article in js["items"]: # ここで見たい情報をまとめる ret += article["title"]
取得したサイトの更新情報の1つ1つのページはjsonの「items」内にあるので、ここをループしています。
items内の「title」を例文では取得していますが、これはそのページのタイトルです。
実際にどんな情報がjson内に含まれているかは公式のWebAPIのリファレンスを見てください。
当該APIのリファレンス
5.【python】取得した情報をテキストファイルに保存する
以下のように取得した記事の更新情報をテキストファイルに保存しています。
「CommonFunction.updFileContent」メソッドは単にテキストファイルに保存しているだけです。
# ウマ娘記事取得 content = "" content += getArticle("feed%2Fhttps%3A%2F%2Fchomagireko.blog.jp%2Findex.rdf") CommonFunction.updFileContent(trgtFolder + "ウマ娘.txt", content)
ここで先ほど説明を省略して、「getArticle」メソッドの引数にすべきstreamIdを使っています。
streamIdですが、Feedly のページでそのサイトのページを開いてURLから確認できます。
画像クリックで等倍
FeedlyAPIのキツいところ
作った上でFeedlyAPIのキツかったところは以下です。。
(もしかしたら知らないだけでもっといい方法があるのかもしれませんが)
  • APIの利用回数制限が中々厳しい(24時間で250回? 有料プランだと増えるのかは不明)
  • 1回のAPIで1つのサイトの更新情報しか取れない(前述の利用回数制限に抵触しやすくなる)
ちなみに以下の記事がこの方法で作成されているページです。 サンプル
コメントログ
コメント投稿




広告枠
関連ページ
【プログラミング】実例で分かるかもしれない再帰処理
本ページは以下動画の台本を書き起こしたものです 解説の趣旨・方向性 皆さん、こんばんは今回はプログ…
SNSツイート一元化対応(Twitter・Misskey・Mastodon・Bluesky)-公開
概要 SNSツイートを一元化するためのツールを作成しています(古い記事ですが、こちらのページで紹介…
SNSツイート一元化対応(Twitter・Misskey・Mastodon・Bluesky)-Python
概要 概要 SNSのツイートを一元化する際の備忘録というかPythonコードの共有です。 それぞれ…
Windows-PowerShellを使用してのフォルダ内のファイル名を連番にリネームする
以下PowerShellコードを実行することで、フォルダ内のすべてのファイルのファイル名を「0001…
SCSSとやらでメディアクエリと疑似要素の組み合わせに小一時間苦戦したという話
SCSSとやらでメディアクエリと疑似要素の組み合わせに小一時間苦戦したという話 当然ですが本サイト…
ボタンを押す演出でCSSのtranslateYやtopを使用することの問題
ボタンを押す演出でCSSのtranslateYやtopを使用することの問題…
東京03のyoutubeチャンネルの概要ページの挙動がおかしい
東京03のyoutubeチャンネルの概要ページの挙動がおかしい…
Youtube Data APIでハンドルIDからユーザ情報を取得できない
Youtube Data APIでハンドルIDからユーザ情報を取得できない問題 結論から言うと現在…
ウマ娘まとめサイト(InoReader)
ウマ娘まとめサイト(InoReader)…
ウマ娘まとめサイト(Feedly)
ウマ娘まとめサイト(Feedly)…
最新ページ
メンバーシップ特典
概要 ※こちらは現在準備中のコンテンツです。 ここでは別のサービスを使って行っているメンバーシップ…
一部「アークナイツ必要素材数集計ページ」コンテンツのメンバーシップ特典への移行の予告
概要 現在、本サイト上で公開してる一部のコンテンツを何らか(ファンボックスのようなサービス)のメン…
アークナイツ-5周年商品-理性換算
概要 "「5周年商品」および「新常設商品」でお得な商品はどれか"というのを理性に換算して一覧化した…
アークナイツ:生息演算「熱砂秘聞」の攻略メモ
注意 本ページには攻略情報も一部含まれてるので、そういうのを見たくない人は見ない方が良いです。含ま…
L'Arc~en~Cielの曲を個人的に評価した
本ページについて ラルクの中で各曲を個人的に評価して★0個から5個までを付けています。 ★0個が基…
アークナイツ:全★4オペレータの強み
本ページの概要 ここでは★4オペレータを全員、自分なりの所感を書いてます。書いている順番は昇進2率…
本サイトについて
本サイトの概要 個人ブログのようなものです。とくにジャンルはありません。 本サイト内の情報について…
普通の文章をホラーっぽく変換
テキスト:ホラー変換 変換する度に結果が変わります 変換回数: 変換する 変換結果 変換する…
アークナイツ-「二次創作ガイドライン」と「ファンキット利用ガイドライン」の関連について
本記事の概要と注意点 本記事の趣旨・方向性 「アークナイツの二次創作ガイドライン」について、分から…
怖い話(AI)まとめ - Part02
最初に 怪談系の怖い話を載せています。 特に設定部分は人の手が入ってますが、なるべく生成AI(Ch…
管理人ツイート
本サイトのタグ一覧
NovelAIR18VRoidWebサイト作成Webツールアークナイツアークナイツ-ステージ攻略日記アズールレーンアズールレーン-日記ウマ娘ギャラリーゲームデビラビローグプログラミングホラーポケットタウン怪談気ままな日記情報技術情報技術-WebAPI知的財産権統合戦略白夜極光本サイトについて魔王スライム様がんばる!漫画
広告枠