微妙な検索ツール開発プロジェクト
Google APIを使用して検索するPerlプログラムは1年ほど前に作ってあるのですが、何もせずに放置していたものを活用して、一風変わった検索ツールを次々に作ってみようかと。
基本的に検索式でそのまま検索を行い、結果として得られたURLにもアクセスを行い、内容を判断して絞込みを行う、ということになります。
今考えているのはこんな感じ。基本的に1機能1晩開発になると思いますが、何か面白そうなのがあったらネタください。
- 解説ページ検索
"〜〜とは"等のフレーズを含むページに絞り込む
- 個人サイト検索
アルゴリズムは企業秘密ですが、個人サイトと思わしきページに絞り込む
- 小説ページ検索
ページ構成や文字数で判断し、絞込み
- 文字数指定検索
○○文字以上/以下のページに絞込み。タグは除外。
- PDF一括保存
検索結果をPDFに絞込み、ファイル名をタイトルにして一括保存
- 日本語ページ検索
中国語や韓国語のページを除外する
- 新規サイト検出
前回の検索結果と比較し、新規サイトを検出する
などなど。2月3月に息抜きがてら作っていきたいところです。
なお最悪研究室限定公開。よくて学内公開。