Erogeek Conference #1 でも発表した、日本のある程度有名なAV女優一覧を取得するPerlモジュール 「Acme::JapaneseAvActress」をCodeReposにアップしました。 合計で2600名のAV女優が今のところリストアップされます。
一人のAV女優には
- name(漢字を含む名)
- yomi(読みふりがな)
- initial(頭文字ふりがな)
- year(デビューの年西暦)
というプロパティを持っています。 仕組みとしては、 Wikipediaの日本のAV女優一覧というページのExportというXMLを出力するサービスから、 正規表現でごりごりスクレイピングしています。 Web::Scraperは使ってません。
使用例として、例えば、2007年にデビューしたAV女優をData::Dumperでダンプするには
use Acme::JapaneseAvActress;
use Data::Dumper;
my $actress = Acme::JapaneseAvActress->new(
{
'cache_root' => '/tmp/avactress',
'default_expires' => '7days',
}
);
$actress->get;
my $actlist = $actress->year("2007");
print Dumper($actlist);
出力結果は
$VAR1 = [
bless( {
'name' => 'あいかわゆら',
'yomi' => '',
'initial' => 'あ',
'year' => '2007'
}, 'Acme::JapaneseAvActress::Actress' ),
bless( {
'name' => '愛澤こころ',
'yomi' => 'あいざわ こころ',
'initial' => 'あ',
'year' => '2007'
}, 'Acme::JapaneseAvActress::Actress' ),
bless( {
'name' => '合沢萌',
'yomi' => 'あいざわ もえ',
'initial' => 'あ',
'year' => '2007'
}, 'Acme::JapaneseAvActress::Actress' ),
bless( {
'name' => '相沢桃',
'yomi' => 'あいざわ もも',
'initial' => 'あ',
'year' => '2007'
}, 'Acme::JapaneseAvActress::Actress' ),
bless( {
'name' => '愛嶋リーナ',
'yomi' => 'あいしま りーな',
'initial' => 'あ',
'year' => '2007'
}, 'Acme::JapaneseAvActress::Actress' ),
…
こんな具合です。$actress->year("名前"); なんてやると、その名前がAV女優かどうかチェックできたりします。 また、Cache::FileでWikipediaのExportページをキャッシュする機能もついています。 CodeReposの以下においておくのでよっぽど物好きの人は使ってください。あ、そうそうCPANにAcme::Playmateというのがあるので、 そのうちこれでCPAN Authorになっちゃうかも!