« 2009年1月 | トップページ | 2009年3月 »

2009年2月

2009.02.26

【iPhone】アプリ4の2 iDic用ウィキペディア辞書作成に挑戦

iDic用のウィキペディアについては、雑誌の付録で調達したことについては、すでに書いたとおりだ。このデータについては、ネットで検索すれば、どこかで調達することも可能なようだ。

しかしながら、自分でウィキペディアをepwing化し、iDicの辞書に変換する方法が紹介されているので、土日をつぶして、ウィキペディア日本語版のデータをepwing化し辞書データを作成することに挑戦してみた。何度も失敗し、環境も何回も作りなおしたが、最終的に、辞書データを作成する方法がわかったので、紹介したい。

1.前提条件

  • ウィキペディアの画像データについては取り込めれば便利だとは思うが、取り込む方法はわからなかった。画像データは放棄する。
  • 特殊な数式については、画像化して取り込むことができるようだが、何回もトライしたが、ImageMagickなどの設定方法がわからなかったので、数式の画像化もあきらめる。

というように画像化をあきらめれば、CygwinというWindowsXP上で動くLinux環境で、比較的簡単にiDic用の辞書に変換することができる。

ただし、辞書に変換するために、3時間半の時間が必要なので、事前準備も含めれば5時間以上の時間がかかることは覚悟しなければならない。

ちなみに、私のパソコンの環境は、2007年末に購入したもので

  • HP 6710b ノートブック WindowsXP
  • インテル® Celeron® プロセッサ 540(1MB L2キャッシュ、1.86 GHz、533MHz FSB)
  • メモリ 2GB

という環境なので、もう少し古いパソコンならば、かなり時間がかかることを覚悟しておいた方がよい。(変換作業は、寝ている間か、外出している間に行おう)

ここから先は、いろいろなアプリを入れるので自己責任でおねがいします。

※参考にしたサイト

たそぶろ iPod touchでウィキペディア(Wikipedia)を持ち歩く

特別編:wikipediaを入れてみる -iDic

あさりのみそしる ウィキペディアを持ち歩け! ~FreePWING を導入する~

2.事前準備

1)解凍ソフトLhaplusのインストール

今回の作業ではLinux系の圧縮ファイルtar.gzとかbz2を解凍しなければならない。

Lhaplusならば、どちらも解凍できるので、これをインストールしよう。

Lhaplusはこちらのサイトでダウンロードできる。

ファイルをダウンロード用のフォルダーにダウンロードし、ダブルクリックすればインストールが始まる。インストールしたら、関連づけで、個人的にはすべてにチェックを入れ、解凍先、圧縮先はアーカイブファイルと同じフォルダーに設定しておこう。

2)Cygwinのインストール

CygwinとはWindowsのパソコン上でLinux系のアプリケーションを動かすソフト。個人的には、これを入れると、なぜかパソコンが重くなるような気がして、あまり近寄りたくはないのだが、今回はLinux系のソフトを使うので、やむなくインストール。

Cygwinのダウンロードはこちらのページにある「Install Cygwin Now」をクリックする。

Setup.exeというものがダウンロードされるので、それをダブルクリックすれば、インストール作業が開始される。標準のまま「次へ」を選ぶと、途中でダウンロードサイトの一覧が表示される。それぞれ微妙に違うらしいが、よくわからないので一番上をクリックした。

「Select Package」というところで

-1.カテゴリーArchiveの項目にある「zip」がSKIPとなっていたらクリック。バージョンが表示されれば、インストールされる。以下同様に

-2.Devel:make

-3.Perlはカテゴリそのものをクリックして全部をインストールに変更

-4その他 .Utils:bzip2、WEB:wget、Devel:Patchなどが参考にしたサイトに紹介されていたが、特に今回は使用しない。

あとは、次へを選択してパソコンにインストール。完了直前にデスクトップにアイコンを作成するにチェックを入れる。

インストールが完了したら、デスクトップのアイコンをダブルクリックして、必ず一度起動させてみよう。

 ユーザー名@パソコン名

と表示されたらOK。「exit」と入力して終了させる。

3.Wikipedia関係のファイルのダウンロード

1)Wikipediaのデータのダウンロード

データがおかれている「Index of /jawiki/」のサイトのlatestフォルダーをクリックし、その中の「jawiki-latest-pages-articles.xml.bz2」というファイルをダウンロード

2)FreePWINGとwikipedia-fpwのダウンロード

Kazuhiro's blogの中で紹介されている最新のFreePWINGとwikipedia-fpwをダウンロード

4.ファイルの解凍

ダウンロードした3つのファイルを、右クリック>解凍>ここに解凍で解凍する。

「jawiki-latest-pages-articles.xmlフォルダーの中のjawiki-latest-pages-articles.xmlというファイル」を名前の変更で「wikipedia.xml」に変更し、「wikipedia-fpw-xxxxxxxxx」のフォルダーに移動する。

※もしも、「jawiki-・・・・・.xml」が「ほかの人またはプログラムで使用され」ているというようなコマンドが出て名前を変更できないときは、unlockerのサイトから、unlockerというソフトをダウンロード(下の方の「Unlocker 1.x.x - From this website」という行のところをクリック。窓の杜のレビュー)し、インストールしてみよう。クリックすると別ウインドウに一覧が表示され、ファイルを選択してunlockボタンを押すと、名前の変更や移動が可能になる。

5.設定の変更(数式の画像化をやめる)

「wikipedia-fpw-xxxx」のフィルダーの中にある「wikipedia-fpw.conf」というファイルをエディターで開く。メモ帳でもよいのだが、改行がうまく認識されないので、サクラエディターのパッケージ版などをインストールして開くと良い。

38行目の「  'enable_math' => 1,」を「  'enable_math' => 0,」に変更

6.解凍したファイルをコピー

Cygwinのフォルダーは標準では、C:\cygwinにあると思う。

さきほど解凍した「FreePWINGXXXX」「wikipedia-fpw-xxxx(wikipedia.xml入り)」のフォルダーを

C:\cygwin\home\ユーザー名\のフォルダーにコピーする。準備完了

7.Cygwinの作業開始

1)FreePWINGのインストール

Cygwinを起動し、以下のコマンドを入力

cd freepwing-1.6 

 (cdはchange directory free・・フォルダーに移動)

./configure

make ;make check ;make install

ここまででFreePWINGがインストールされる。

2)wikipediaの変換作業開始

上に続けて

cd ../wikipedia-fpw-20090220

fpwmake  ここで変換が始まる。待つこと3時間

fpwmake catalogs

fpwmake package ここで圧縮作業が行われる

以上の作業が完了すると「wikipedia-fpw-20090220.zip」というZIPファイルができで完了。

fpmakeを実行すると、見出しのチェックがはじまり、1087271項目(20090220版の場合)、次に、各項目の変換作業が始まり、1087271項目の変換が終わったのが、9156秒(2時間32分36秒)後、さらにそこから作業が続く。

zipファイルを解凍するとWIPというウィキペディアのepwing化された辞書ができあがる。

辞書を圧縮したい場合は、「たそぶろ iPod touchでウィキペディア(Wikipedia)を持ち歩く」

を参考にしてトライしてみてください。

cygwinの終了は「exit」を入力のこと。

さあ、これで、いつでもウィキペディアの最新版を使えるぞ!!

2009.02.19

【iPhone】アプリ4 iDic

すでに「iPhoneでepwing辞書が使えるiDic登場」でiDicについては紹介済みだが、ここで再度登場させよう。

1.個人的辞書遍歴

専用の電子辞書も持ってはいるものの、PDAを購入すると、必ず何らかの形で、国語辞典、英和・和英辞典を購入し携帯しなかったことはない。しかしながら、どれだけ活用したかというと、投資した分に見合うほど活用はしなかった。さらに、PDAが変わると、フォーマットが変わるので、同じような辞書を買い換えなければならなかった。広辞苑も数冊持っていることになる。

ZAURUSを購入し、epwingという、いろいろなPDAで使える辞書群の存在を知り、物草さんの私家版携帯端末考の「なんとかなるさLinuxZau」(なお、このサイトは一度閉じられたが内容が充実しているのでyaktyさんがサイトをそのまま引き継いでいる)を参考にしたりしながら、広辞苑だけでなく、平凡社の世界大百科や辞典館などを購入し、epwing化して使うようになってきた。Windows Mobileでもこのフォーマットは有効だ。

2.iDicの登場で毎日辞書引き

iPhoneにepwingの辞書引きソフトであるiDicが登場した。zaurus時代の辞書が使える。すでにウィズダム英和・和英辞典を購入していたものの、すぐiDicに飛びついた。

iDicがあれば、zaurusで使っていた世界大百科、現代用語の基礎知識、マイペディア、広辞苑、英辞郎などが使えるのだ。しかも、それらの辞書をまとめて串刺し検索することができる。

さらに、雑誌の付録でWikipediaをepwing化したものがついてきたので、これもインストール。

Wikipediaは、もちろんこれまで何度も利用してきたが、手元におき引いてみると、zaurus時代の辞書がカバーしていないジャンルや用語をカバーしていることがわかった。

日付をいれれば、その日の事件がわかるし、映画やドラマのタイトルをいれれば、出演や監督までわかってしまう。専門用語も登録されていることが多いし、本文中の用語にリンクがはってあり、一つの言葉から次の言葉へ広がっていく。

手元においてみて初めて、これまでその能力の何分の一も使っていないことがわかった。残念ながら雑誌はすでに書店から姿を消していると思うが、Wikipediaのデータをepwing化する方法が紹介されているので、トライしてみてはいかがだろう。

※googleで検索したらこんなサイトを発見。

2/28追記

iPの2009年4月号にもWikipediaのデータが搭載されるようだ。

iDicを搭載して、毎日気軽に何度も辞書を引くことになった。

3.iDicはさらに進化をとげる

現在、iDicのバージョンアップのテストが進んでいる。現在バージョン1.983まできており、開発作業が進んでいる。新しいバージョンでは、

  • 辞書グループが複数階層で設定できる。
  • 全文検索ができる。
  • 単語の検索だけでなく、辞書のメニューからの検索ができる。
  • 検索語の前後の項目を確認できる。

そのほかにもいくつも新しい機能が付け加えられている。

私にとっては、全文検索の機能が特にうれしい。

通常の辞書は見出し語の中しか検索できない。しかしながら、例えばフリーの歴史データベースだと、見出しは、「0645/07/10(皇極04/06/12)」という年号しか書かれていない。これは、本当に細かいデータベースで見出し件数で66,666件もデータがある。しかし、年数がわからなければ辞書が引けないのだ。誰だって「大化の改新」は何年かを知りたいのであって、「645年に起きた出来事は何か」なんて調べ方はしないだろう。本文から検索ができることではじめてデータベースが役に立つ。

また、epwingには、電子ブックと呼ばれる形式がある。例えば、手紙文例集、法律用語辞典などは、見出し語が単純にあいうえお順に並んでいるのではなく、メニュー(目次)から項目を検索して本文にたどり着くという形式なのだ。せっかく豊富な中身があるのに、検索語を思いつかなければ、目指すものにたどりつけない。zaurus時代にはほとんど役に立たなかった。ところが、全文検索ができれば、目指す項目に簡単にたどりつける。

さらに前後の項目を表示する機能もつくので、知識も広がっていく。

そのうえ、うれしいことにこれまでのPDAではできなかった、メニューからの検索もできる。例えば、広辞苑のメニューには、「文学作品・歴史資料」などがついているし、現代用語の基礎知識では、「経済、産業、経営・・・」などジャンル別の項目があり、それぞれの項目にいろいろな項目が書かれているので読み物としても使えるようになる。学研の漢和大辞典だと日本の家紋なんていうのもあり、家紋の挿絵までついている。まさか漢和辞典で家紋を調べようなんて思わないだろう。

今度のバージョンは期待していい!!

2009.02.18

【iPhone】アプリ3 さいすけとMemStatus

カレンダーと言えば、Windowsモバイルの時代からさいすけだ。いろいろなPDAを使ってきたが、標準のPIMは必ずついているが、その後バージョンアップを重ねたものはほとんどない。さいすけは日々進化しており非常に使い勝手が良くなっている。

とはいえ、一番の理由はGoogleカレンダーと簡単に同期できることによる。

1.Lotus Notesからのインポート

会社がLotus Notes 6.5 を使用しており、このカレンダーのデータを何とか利用できないかと考えていたのだが、Notes > Googleの一方通行ではあるが、簡単にNotesからの書き出しとGoogleカレンダーのインポートができることがわかり、さいすけの価値がさらに増大した。

Notesのカレンダーをワンクリックで書き出すには、

しょうけん's Blogさんの「Notes/Googleカレンダーの同期」のところのスクリプトを、Notesのエージェントを新規作成して、Initializeセクションに貼り付ける。

ただし、

If (doc.form(0) "Reply" And doc.form(0) "Notice") Then

の行は

If (doc.form(0) <> "Reply" And doc.form(0) <> "Notice") Then

というように修正する必要がある。

そして選択文書を対象にして、会議の一覧で書き出したい範囲にチェックマークをつけ、このエージェントを実行すると、Googleカレンダー用の形式に書き出してくれる。

あとは、invitelist = ""

としたほうが、うるさくないように思える。

できあがったテキストをGoogleカレンダーにインポートすればよい。重複があっても、同一のデータはダブルで取り込まないので安心だ。ただし、スケジュールが修正されていた場合は、同じところに2つの項目ができるので、古いほうを削除する必要がある。

個人的には、「Work」というカレンダーを追加し、そちらにNotesのデータ、標準のカレンダーは、プライベート用として、さいすけでスケジュールを追加するときは、こちらに書き込み色分けしている。

Googleカレンダーには、公開カレンダーという機能があって、イベントなどのカレンダーを追加して調法していたのだが、いつのまにか検索ができなくなったのは残念だ。公開カレンダーの取り込み機能はなくなっていないようなので、もしも興味のある公開カレンダーのURLがわかったら、登録しよう。

続きを読む "【iPhone】アプリ3 さいすけとMemStatus" »

【iPhone】アプリ2 Safari

RSSリーダーからサイトを確認するにせよ、地図を見るにせよ、結果的に一番使用頻度が高いのが、Safariだろう。

ブックマークの使い方や、iPhone関係のリンク先は他のサイトで見てもらうことにして、個人的に一番活用しているのがブックマークレットであるので、ここではブックマークレットの活用について話すことにしたい。

ブックマークレットとは、Javascriptで書かれた小さなプログラムのことで(Wikipedia)、ブラウザのブックマークに登録し、通常リンク先のURLを登録する代わりにjavascriptを書き込み、ブックマークを選択すると、そこに書かれているプログラムが実行されるのだ。

iPhoneで使えるブックマークレットがで「iPhone 3Gで使える! ブックマークレット大辞典」特集されている。登録の仕方も最初の方に書かれているので参考にするとよい。iPhoneで直接登録もできなくはないが、PCのSafariに登録し、iPhoneと同期をとるのが良い。

そのほかにも、Googleで検索すればいろいろなものが見つかると思うが、個人的に使う頻度の高い、1.無線LANスポットの自動ログイン、2.住所をマップに送る、3.あとで読む(WEBクリッピング)の3つを紹介しよう。

続きを読む "【iPhone】アプリ2 Safari" »

2009.02.15

【iPhone】アプリ1 iPod

iPodの基本的な機能について今更のことだと思う。

野口悠紀雄氏のポケット一つの原則に則って、音楽、動画は最終的にはiTunesに保存している。

  • 音楽 11,453曲(35.5日) 47GB+Podcast 3,218件(33.2日) 31GB
  • 動画 826項目(10.9日) 55GB+テレビ番組 193項目(6.1日) 28GB
  • アプリケーション 190項目

というわけで、すでにiPodには収まらなくなってきたが、一元管理をiTunesで行っているのだ。ここではちょっとした活用方法について触れてみたい。

1.Podcastを楽しむ

Podcastには、ビジネスに役立つニュースや英会話や読書ガイドがあるので、もうすでに利用している人が多いだろう。個人的には日経ニュース、藤沢久美の社長トーク(ソフィア・バンクステーション)、勝間和代のBookLoversなどが参考になる。

2.オーディオブックで本を読む

以前はオーディオブックといえば、英語のものが多かったが、勝間さんが積極的に勧めていることもあって、次第に充実してきている。

続きを読む "【iPhone】アプリ1 iPod" »

2009.02.14

【iPhone】愛用のアプリ on ビジネス

PDAをこれまでいろいろ使ってきたが、iPhoneが現在一番のお気に入りだ。

ちなみに、これまで使ってきたのは、カシオペア、オアシスポケット、Palm(WorkpadC3、Visor、clie)、Jornada、sigmarion1、2、3、Psion、200LXそしてzaurus、WZero3。何機種か購入したものもあるので、合計30台ぐらいのPDAを購入してきた。

その中で今一番期待しているのがiPhoneなのである。

その理由は、アプリケーションの開発が活発であるこのにある。これまでのPDAはいずれもアプリケーションの開発が一部の開発者に限定されており、アプリケーションの開発があるところで止まり、新しいアプリは新しい筐体に買い換える必要があった。理由としては必ずしもSundayプログラマーが開発しやすい環境(シェアウエアの資金回収の方法も含めて)が提供されてこなかったことにあろう。WindowsCEなどは、あたらしい機種がでるたびにOSが代わり、ひとつのアプリを提供するために、3種類のプログラムを作らなければならなかった。

Psionなどは、面白いギミックを搭載していながら、日本語の完全なアプリを開発することができなかった。

iPhoneはCNet Japanの記事によれば、すでにアプリの本数が1万5000本を超えている。コピー&ペーストができないとか、外付けキーボードが使えないなど、まだまだ制約はあるが、いずれ解消されるだろうと思っている。

現在使っているビジネスに役立つ(かもしれない)アプリについて、ちょっとしたTIPSも含めて紹介したい。

続きを読む "【iPhone】愛用のアプリ on ビジネス" »

« 2009年1月 | トップページ | 2009年3月 »

最近のトラックバック

2015年7月
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31