堕天使の煉獄
2017-08
06
03:04:23
なんだか久々にPG
コミック発売リスト検索
以前作った、漫画発売日の載ってるサイトから解析してリストを取得し、お気に入りの作家名、タイトルなどを登録しておくと、一括で検索する~みたいなの。
を、いろいろ改良。
こんなツール普通にあるだろとおもったのだけども、意外に無いんですよね……。なので自作の流れで。
しかしこの界隈、相変わらずお寒い状況ですね。
最近倒産してしまって、サイトも無くなってしまった「太洋社」のコミック発売リストが一番良かったなぁ(遠い目)
最近見つかる奴は、原作者と漫画が分かれてるとき、どちらか片方だけで両者の名前がない。レーベル名と出版社名どっちか欠けてる。成年コミックが除外されてる。1ページでひと月分の情報が見れない。
と、どれも使いにくいサイトばかり。
なんでこんなお寒い状態なのかといえば、そもそも、発売日リストの大元の問題があるんじゃ無かろうかと。
あんまし業界の人でもないので詳しくはないのですが、よく本屋で目にする黄色い紙の発売日のリスト。あれって書店とか出版社でなく、取り次ぎの大手のトーハンが発行して書店に配布してる物らしいですね。
んで、あの発売日情報のリストをcsvとかで配布してるようなところないのかなーと以前この辺の情報あさった時に、まずこの発売日リスト、なぜか一般人が入手するのは難しいと言うこと。書店など企業に配布されるのみで、一般には出回らないのだとか。
そんでもって、想像なんですけど、これって紙媒体とかでしか配布されてないんじゃないでしょうかね……。
もしこれがトーハンなどの一次発行元がcsv等の扱いやすいデータの形で配布してるのなら、もっとサイトで閲覧出来るところがいっぱいあるはずですよね。
ちょいと加工して乗っけるだけなんですからとっても簡単な筈。
それが、こんな数が少ない上に情報が欠落してる所が多いサイトしかないのって、紙媒体とかでしか情報がやってこずデジタライズの作業が発生するので、そんなところに人も時間もさけねぇよって感じで、まともな情報サイトが存在しないんじゃないだろうか……。
なにげに書店関係って、結構デジタル化遅れてるんですよね。
以前に講談社のコミックスにバーコードを印刷しなくなった~の話から、スリップをなくす話までいろいろと改革の兆しがあったようなのだけども。
そこで、スリップ=本の間に挟まってる栞みたいなの。アレを本屋さんは集めてどのぐらい売れたかとか追加発注するときの指標にするらしい。が無くなることについて、書店側の意見からは、POSデータでも売り上げはみれるけど、やっぱ昔ながらのスリップで売り上げ管理をしたい……っていう意見が結構多かったそうで。
なんかそういう話を聞くと、ああ、それで発売日リストすらもデジタル化したりしねーのかな。
と業界全体が遅れてる感を感じた物です。
まあ、それはおいといて。
以前作った時は、たまたまQTの新しいverがでてきて、新しい機能をのぞいていたら、QTで簡単にブラウザつくれまっせ。みたいなのがあって。
で、それなら発売日のサイトから情報ぶっこ抜いて検索出来るのとか簡単につくれるんやない? と思って。
毎月サイト上のリストを上から順にながめてると、やっぱ見落としとかあるし、検索でさくっと出したい。
んでも複数の検索ワードを登録して一括で……ってのがブラウザじゃ出来ないんですよね。
そんで最初はfirefoxのアドオンでそゆの作ってみようかなとおもったのですが。
なんかそのときはアドオンの仕様が新しい奴がもうすぐ出て互換性なくなりまっせ。みたいな話(しかもしょっちゅうあるし……)があって、なんか今手を出すのもアレだなーってのもあって。あとfirefox限定でしか使えないのも将来的にな……とも。
で、さくっとQTでサイト取得して情報もゲットーってのは驚くほど簡単に作れたんですけど(ブラウザがこんなかんたんいつくれるもんなんやねーと驚いた)難点は重い。
ブラウザを立ち上げてる分けですから起動も遅いし、表示も開始の部分が重い。
そこで、なんかその辺の情報あさってたところで、QWebEngineViewじゃなくQNetworkAccessManagerちゅーもんが結構前からあったらしい。
で調べてみると、なんだ、いわゆるwin32でのwinsock的な低レベルのAPIあるんじゃんと。
そもそもサイトの情報ぶっこ抜くだけなので、サイトの内容を表示する意味無いし。サイトのhtmlとかだけDLするならリクエスト送ってデータ受け取るだけでええやんと。
なんてことに気づいて、早速組み替えてみる。
したらめっさ軽いw
そりゃまあ、前のはアプリたちあげる毎にブラウザも立ち上げてたものだからなぁ。
で、随分これで扱いやすくなったなとおもったらば。
かつての太洋社に比べれば不満たらたらだけどもそれなりに使用に耐えれそうな情報サイトはリストアップしてあったのだけど、試してみたらば接続に失敗するものが……。
……サイトがSSL化してやがるっっ!!
以前はhttpだったのがhttpsにいつの間に変わってやがりました……。いやSSL化流行だけどさ。そんなんよりも内容何とかしろよ。とかぶーぶーいいながらも、sslはどうやって対応すれば良いのかとググってみると。
なんだかブチめんどくさい感じぽ。
とりあえずOpenSSLをインスコして、ライブラリにリンクしてアプリの場所にいくつかのdllを置いとけば良いらしいんですが。
なんかQTのverとOpenSSLのverでなんか動かない組み合わせがあるとかで。
とりあえず試しに最新版のOpenSSL v1.1.0f試してみたらなんかダメっぽい。これじゃない感w
も一つのOpenSSL 1.0.2lを試してみたらば……おお。
QSslSocket::supportsSsl = true
キター!
あんま日本語の解説サイトすくなくていまいちよくわかってない感じなのですが。とりあえずhttpsのサイトにリクエスト送ってデータを受け取れる様に。
てかOpenSSL v1.1.0系と1.0.2系の違いってなに?
OpenCVの2系と3系みたいなもんなのか??
古いverだと脆弱性が……とかいう情報もヒットするのだけど、どれがその古いVerなのかもよくわかんねーし。
まあ、動いたから良しとするか(ぉ
で次につまずいたのが……。
QWebEngineに比べてQNetworkAccessManagerのがものすごくさっくり手軽にサイトのデータ持ってこれるので、ちょっと欲張って成年コミックの発売日リストのサイトも対応してみようかと思い立つ。
で、したらそのサイト。
年齢認証があるんですよね。そのあとリダイレクトでジャンプして~とよくある奴です。
……このリダイレクトの処理の先のサイトにどうやってアクセスするのかが判らん……。
普通に取得できるのは年齢認証の画面のhtmlで。そのなかの「はい」を選んだときのURLはなんかphpで単純にジャンプさせてるだけで、もとのurlの後ろにcheck=trueというパラメータが付いている。じゃあcheck=true追加したurlで飛べるのかなとおもったのだけどもリファラのチェックでもしてるのかphp経由のジャンプじゃないとダメっぽい?
こういうちょっと突っ込んだところになると、英語のドキュメント読みあさるより他なく、わけわかめ。
なんとなく、リダイレクト先のURLをうけとってこれるメソッドがあり、それでもっかい同じ接続に使ってるところからアクセスするっぽい??
って感じでいろいろとためして、何とか動くように。
はふー。
QTのライブラリではアレに対応する機能はどれになるのかなー的に大昔にwinsockでなんかやってたころの記憶が助けになったぽ。てかものすっごくうろ覚えのうっすい記憶しかないぐらい遠い昔の話だけどw
てかなんだかんだでこのツールって作ってみて、cgiの一種なんやねと。
リクエスト出して応答うけとって~と。こもんげーとうぇいいんたーふぇーすってやつ。
やってる事はperlでも一緒だなーとおもうと、ああ、なんだそういことか。と気づくこともあったりして。
殆ど出来上がったところで、一気に全体が理解出来きてきて遅いよ……とお間抜けな感じでしょぼん。
そんな感じで久しぶりにPGやった~。
追記:
そいやテストも兼ねてこの発売日リスト毎月一回起動してたりするんですが。
ここ数ヶ月、ずっと鶴田謙二の冒険エレキテ島 2 が延々毎月のリストに載ってるのが嫌でも目に付くw
相変わらずあの人は遅れまくるんだなとw
発売日一旦出た後未発売で音沙汰無くなるのもアレだけど、毎月何事もなかったかのように毎度載ってるのもなんだかアレだな……w
以前作った、漫画発売日の載ってるサイトから解析してリストを取得し、お気に入りの作家名、タイトルなどを登録しておくと、一括で検索する~みたいなの。
を、いろいろ改良。
こんなツール普通にあるだろとおもったのだけども、意外に無いんですよね……。なので自作の流れで。
しかしこの界隈、相変わらずお寒い状況ですね。
最近倒産してしまって、サイトも無くなってしまった「太洋社」のコミック発売リストが一番良かったなぁ(遠い目)
最近見つかる奴は、原作者と漫画が分かれてるとき、どちらか片方だけで両者の名前がない。レーベル名と出版社名どっちか欠けてる。成年コミックが除外されてる。1ページでひと月分の情報が見れない。
と、どれも使いにくいサイトばかり。
なんでこんなお寒い状態なのかといえば、そもそも、発売日リストの大元の問題があるんじゃ無かろうかと。
あんまし業界の人でもないので詳しくはないのですが、よく本屋で目にする黄色い紙の発売日のリスト。あれって書店とか出版社でなく、取り次ぎの大手のトーハンが発行して書店に配布してる物らしいですね。
んで、あの発売日情報のリストをcsvとかで配布してるようなところないのかなーと以前この辺の情報あさった時に、まずこの発売日リスト、なぜか一般人が入手するのは難しいと言うこと。書店など企業に配布されるのみで、一般には出回らないのだとか。
そんでもって、想像なんですけど、これって紙媒体とかでしか配布されてないんじゃないでしょうかね……。
もしこれがトーハンなどの一次発行元がcsv等の扱いやすいデータの形で配布してるのなら、もっとサイトで閲覧出来るところがいっぱいあるはずですよね。
ちょいと加工して乗っけるだけなんですからとっても簡単な筈。
それが、こんな数が少ない上に情報が欠落してる所が多いサイトしかないのって、紙媒体とかでしか情報がやってこずデジタライズの作業が発生するので、そんなところに人も時間もさけねぇよって感じで、まともな情報サイトが存在しないんじゃないだろうか……。
なにげに書店関係って、結構デジタル化遅れてるんですよね。
以前に講談社のコミックスにバーコードを印刷しなくなった~の話から、スリップをなくす話までいろいろと改革の兆しがあったようなのだけども。
そこで、スリップ=本の間に挟まってる栞みたいなの。アレを本屋さんは集めてどのぐらい売れたかとか追加発注するときの指標にするらしい。が無くなることについて、書店側の意見からは、POSデータでも売り上げはみれるけど、やっぱ昔ながらのスリップで売り上げ管理をしたい……っていう意見が結構多かったそうで。
なんかそういう話を聞くと、ああ、それで発売日リストすらもデジタル化したりしねーのかな。
と業界全体が遅れてる感を感じた物です。
まあ、それはおいといて。
以前作った時は、たまたまQTの新しいverがでてきて、新しい機能をのぞいていたら、QTで簡単にブラウザつくれまっせ。みたいなのがあって。
で、それなら発売日のサイトから情報ぶっこ抜いて検索出来るのとか簡単につくれるんやない? と思って。
毎月サイト上のリストを上から順にながめてると、やっぱ見落としとかあるし、検索でさくっと出したい。
んでも複数の検索ワードを登録して一括で……ってのがブラウザじゃ出来ないんですよね。
そんで最初はfirefoxのアドオンでそゆの作ってみようかなとおもったのですが。
なんかそのときはアドオンの仕様が新しい奴がもうすぐ出て互換性なくなりまっせ。みたいな話(しかもしょっちゅうあるし……)があって、なんか今手を出すのもアレだなーってのもあって。あとfirefox限定でしか使えないのも将来的にな……とも。
で、さくっとQTでサイト取得して情報もゲットーってのは驚くほど簡単に作れたんですけど(ブラウザがこんなかんたんいつくれるもんなんやねーと驚いた)難点は重い。
ブラウザを立ち上げてる分けですから起動も遅いし、表示も開始の部分が重い。
そこで、なんかその辺の情報あさってたところで、QWebEngineViewじゃなくQNetworkAccessManagerちゅーもんが結構前からあったらしい。
で調べてみると、なんだ、いわゆるwin32でのwinsock的な低レベルのAPIあるんじゃんと。
そもそもサイトの情報ぶっこ抜くだけなので、サイトの内容を表示する意味無いし。サイトのhtmlとかだけDLするならリクエスト送ってデータ受け取るだけでええやんと。
なんてことに気づいて、早速組み替えてみる。
したらめっさ軽いw
そりゃまあ、前のはアプリたちあげる毎にブラウザも立ち上げてたものだからなぁ。
で、随分これで扱いやすくなったなとおもったらば。
かつての太洋社に比べれば不満たらたらだけどもそれなりに使用に耐えれそうな情報サイトはリストアップしてあったのだけど、試してみたらば接続に失敗するものが……。
……サイトがSSL化してやがるっっ!!
以前はhttpだったのがhttpsにいつの間に変わってやがりました……。いやSSL化流行だけどさ。そんなんよりも内容何とかしろよ。とかぶーぶーいいながらも、sslはどうやって対応すれば良いのかとググってみると。
なんだかブチめんどくさい感じぽ。
とりあえずOpenSSLをインスコして、ライブラリにリンクしてアプリの場所にいくつかのdllを置いとけば良いらしいんですが。
なんかQTのverとOpenSSLのverでなんか動かない組み合わせがあるとかで。
とりあえず試しに最新版のOpenSSL v1.1.0f試してみたらなんかダメっぽい。これじゃない感w
も一つのOpenSSL 1.0.2lを試してみたらば……おお。
QSslSocket::supportsSsl = true
キター!
あんま日本語の解説サイトすくなくていまいちよくわかってない感じなのですが。とりあえずhttpsのサイトにリクエスト送ってデータを受け取れる様に。
てかOpenSSL v1.1.0系と1.0.2系の違いってなに?
OpenCVの2系と3系みたいなもんなのか??
古いverだと脆弱性が……とかいう情報もヒットするのだけど、どれがその古いVerなのかもよくわかんねーし。
まあ、動いたから良しとするか(ぉ
で次につまずいたのが……。
QWebEngineに比べてQNetworkAccessManagerのがものすごくさっくり手軽にサイトのデータ持ってこれるので、ちょっと欲張って成年コミックの発売日リストのサイトも対応してみようかと思い立つ。
で、したらそのサイト。
年齢認証があるんですよね。そのあとリダイレクトでジャンプして~とよくある奴です。
……このリダイレクトの処理の先のサイトにどうやってアクセスするのかが判らん……。
普通に取得できるのは年齢認証の画面のhtmlで。そのなかの「はい」を選んだときのURLはなんかphpで単純にジャンプさせてるだけで、もとのurlの後ろにcheck=trueというパラメータが付いている。じゃあcheck=true追加したurlで飛べるのかなとおもったのだけどもリファラのチェックでもしてるのかphp経由のジャンプじゃないとダメっぽい?
こういうちょっと突っ込んだところになると、英語のドキュメント読みあさるより他なく、わけわかめ。
なんとなく、リダイレクト先のURLをうけとってこれるメソッドがあり、それでもっかい同じ接続に使ってるところからアクセスするっぽい??
って感じでいろいろとためして、何とか動くように。
はふー。
QTのライブラリではアレに対応する機能はどれになるのかなー的に大昔にwinsockでなんかやってたころの記憶が助けになったぽ。てかものすっごくうろ覚えのうっすい記憶しかないぐらい遠い昔の話だけどw
てかなんだかんだでこのツールって作ってみて、cgiの一種なんやねと。
リクエスト出して応答うけとって~と。こもんげーとうぇいいんたーふぇーすってやつ。
やってる事はperlでも一緒だなーとおもうと、ああ、なんだそういことか。と気づくこともあったりして。
殆ど出来上がったところで、一気に全体が理解出来きてきて遅いよ……とお間抜けな感じでしょぼん。
そんな感じで久しぶりにPGやった~。
追記:
そいやテストも兼ねてこの発売日リスト毎月一回起動してたりするんですが。
ここ数ヶ月、ずっと鶴田謙二の冒険エレキテ島 2 が延々毎月のリストに載ってるのが嫌でも目に付くw
相変わらずあの人は遅れまくるんだなとw
発売日一旦出た後未発売で音沙汰無くなるのもアレだけど、毎月何事もなかったかのように毎度載ってるのもなんだかアレだな……w
Sun
Mon
Tue
Wed
Thu
Fri
Sat
01
02
03
04
05
■
■
びろーん
06
■
■
なんだか久々にPG
07
08
09
10
11
■
■
むしろそっちのが大変
[山の日]
[山の日]
12
13
14
■
■
とど
15
16
17
18
19
20
■
■
もうひといき
21
22
■
■
脳筋切れる
23
■
■
とりあえずほぼ完成
24
25
■
■
最高のテストは実戦
26
27
28
29
30
31
total:2080648 t:110 y:2908
■記事タイトル■
■年度別リスト■
2024年
2024年12月(0)2024年11月(0)
2024年10月(1)
2024年09月(2)
2024年08月(1)
2024年07月(1)
2024年06月(5)
2024年05月(2)
2024年04月(1)
2024年03月(6)
2024年02月(4)
2024年01月(3)
2023年
2023年12月(3)2023年11月(1)
2023年10月(2)
2023年09月(3)
2023年08月(3)
2023年07月(3)
2023年06月(7)
2023年05月(8)
2023年04月(2)
2023年03月(1)
2023年02月(2)
2023年01月(3)
2022年
2022年12月(4)2022年11月(3)
2022年10月(1)
2022年09月(3)
2022年08月(3)
2022年07月(2)
2022年06月(1)
2022年05月(3)
2022年04月(2)
2022年03月(2)
2022年02月(1)
2022年01月(6)
2021年
2021年12月(8)2021年11月(3)
2021年10月(4)
2021年09月(6)
2021年08月(2)
2021年07月(1)
2021年06月(3)
2021年05月(2)
2021年04月(2)
2021年03月(3)
2021年02月(1)
2021年01月(4)
2020年
2020年12月(3)2020年11月(7)
2020年10月(2)
2020年09月(3)
2020年08月(1)
2020年07月(3)
2020年06月(7)
2020年05月(5)
2020年04月(8)
2020年03月(4)
2020年02月(2)
2020年01月(4)
2019年
2019年12月(1)2019年11月(1)
2019年10月(2)
2019年09月(1)
2019年08月(3)
2019年07月(2)
2019年06月(2)
2019年05月(2)
2019年04月(4)
2019年03月(1)
2019年02月(7)
2019年01月(1)
2018年
2018年12月(1)2018年11月(1)
2018年10月(5)
2018年09月(1)
2018年08月(5)
2018年07月(1)
2018年06月(1)
2018年05月(1)
2018年04月(2)
2018年03月(2)
2018年02月(1)
2018年01月(1)
2017年
2017年12月(2)2017年11月(1)
2017年10月(2)
2017年09月(5)
2017年08月(8)
2017年07月(2)
2017年06月(1)
2017年05月(1)
2017年04月(3)
2017年03月(5)
2017年02月(7)
2017年01月(8)
2016年
2016年12月(7)2016年11月(2)
2016年10月(3)
2016年09月(7)
2016年08月(8)
2016年07月(10)
2016年06月(17)
2016年05月(6)
2016年04月(8)
2016年03月(10)
2016年02月(5)
2016年01月(10)
2015年
2015年12月(7)2015年11月(7)
2015年10月(13)
2015年09月(7)
2015年08月(7)
2015年07月(5)
2015年06月(4)
2015年05月(5)
2015年04月(2)
2015年03月(4)
2015年02月(1)
2015年01月(7)
2014年
2014年12月(12)2014年11月(8)
2014年10月(4)
2014年09月(6)
2014年08月(7)
2014年07月(4)
2014年06月(2)
2014年05月(5)
2014年04月(4)
2014年03月(8)
2014年02月(4)
2014年01月(8)
2013年
2013年12月(15)2013年11月(8)
2013年10月(3)
2013年09月(3)
2013年08月(8)
2013年07月(0)
2013年06月(0)
2013年05月(0)
2013年04月(0)
2013年03月(0)
2013年02月(0)
2013年01月(0)
■レス履歴■
■ファイル抽出■
■ワード検索■
堕天使の煉獄
https://rengoku.sakura.ne.jp
管理人
織田霧さくら(oda-x)
E-mail (■を@に)
oda-x■rengoku.sakura.ne.jp