微妙な検索ツール開発プロジェクト

 Google APIを使用して検索するPerlプログラムは1年ほど前に作ってあるのですが、何もせずに放置していたものを活用して、一風変わった検索ツールを次々に作ってみようかと。
 基本的に検索式でそのまま検索を行い、結果として得られたURLにもアクセスを行い、内容を判断して絞込みを行う、ということになります。

 今考えているのはこんな感じ。基本的に1機能1晩開発になると思いますが、何か面白そうなのがあったらネタください。

  1. 解説ページ検索
    "〜〜とは"等のフレーズを含むページに絞り込む
  2. 個人サイト検索
    アルゴリズムは企業秘密ですが、個人サイトと思わしきページに絞り込む
  3. 小説ページ検索
    ページ構成や文字数で判断し、絞込み
  4. 文字数指定検索
    ○○文字以上/以下のページに絞込み。タグは除外。
  5. PDF一括保存
    検索結果をPDFに絞込み、ファイル名をタイトルにして一括保存
  6. 日本語ページ検索
    中国語や韓国語のページを除外する
  7. 新規サイト検出
    前回の検索結果と比較し、新規サイトを検出する

 などなど。2月3月に息抜きがてら作っていきたいところです。
 なお最悪研究室限定公開。よくて学内公開。