情報には、玉と石と呼ばれる2種類あるといわれます。 無論、玉の方が価値ある情報で石の方が使えない情報となる訳ですが、その玉と石の情報の混合されている割合が多いのがインターネットだと考えております。
では、石の情報は本当にいらない情報なのでしょうか? 私はそうは考えません。 インターネットは皆に情報を配信する手段として生み出された物です。 配信された情報が玉と石の混合であるが故にサーチエンジンなる物が出てきました。(それはインターネットというディレクトリの構成上必要だったということもありますが) その玉と石の中から自分の必要な情報を選び出すためにサーチエンジンが日々進化し、googleのようなサーチエンジンが生まれた訳です。
本題に戻すとします。 なぜ石が必要ではない情報と言い切れるかといいますと、例えば普通の人で「NSR50」と検索したとしましょう。 普通の人であればその原付のスペックなどを知りたい人が大抵だと思います。 ですが、情報の中には、「NSR50でどこどこまでいってきました。NSR50の改造点、修理点はここです」など正直マニアックな情報が多く含まれていることもあります。 そのマニアックな情報こそが人により玉ともなり石ともなる情報の一部であることは原付をいじる人にとっては明白でしょうが、一般の人から見れば「そんな情報は必要ないよ。 僕は普通の情報の情報が欲しいんだ。」っていう人もいるでしょう。 そこで情報を振り分ける技術が必要です。 その技術にはRSSだったり、全文検索だったり、リンク集だったり、様々な手法でその情報の分別を試みています。 その情報を完全に区別することはできないと思います。 情報にはその人が必要な情報と必要でない情報が交じっていることが多いからです(混ざっているというのは同一のページに混ざっているということです)
混ざっているwebの中からその情報を選び出すことができればRSSなどを使って更新された情報のみを調べれば良いでしょう。 また、配信側もAnlysticsなどを使ってページ単位での来客率をみれば予測がたてられ、今後の情報の配信に気を使うことができるでしょう。
最後に
情報とのいうのは人により玉にもなり石にもなります。 インターネットは日々大きくなっていると思いますが、私はその大きくなっている状態でもすべての情報をいつかは統治できるような時代が来ると思います。 それは情報を配信する側にもいずれは確固たるポリシーができ、検索する側もそれに応じたツールが用意される時代が来ると思うからです。
私が配信する情報というのは石の情報が多いかもしれないですが、ブログという物の特性上日々起こることに対しての記録でもあるということから、この石でも排出することを私はおそらくやめることは無いでしょう。 それはその情報を求めている人に対しての気遣いもありますが、私自身が必要性を感じる時があれば使える情報として残しておきたいということからです。
水曜日, 5月 02, 2007
システムの基本的な構造
全文検索システムの基本構造
「全文検索システム」といった場合、全文検索を行うためのハードウェア及びソフトウェアを含めた部分をさします。
細かくみてみると、必要なデータを取得する部分、取得したデータをまとめて処理するインデクサと呼ばれる部分、普段Webブラウザでアクセスしている検索画面や、その内部で実際に検索を行っている部分などがある。
インデックスー高速検索の仕組み
インデックスを作るのには多少の時間がかかる、なぜインデックスをあらかじめ作っておいておくかというと、インデックスが高速な検索を実現するための技術だからだ。
たとえるならば、索引を使って引くか、ページを一つずつめくって探すかの違いである。
全文検索の必要性について
おことわり
タイトルには全文検索の必要性とありますが、これは全文検索が万能であるということをさしている訳ではありません。 なぜ全文検索かというと、今私が知っている中で有能な検索方法は全文検索しかないためです。
そして、この記事はNamazuシステムの構築と活用を参考文献としています。
必要性について
まず、この全文検索が必要になった時代背景から書いていきたいと思います。
昔のコンピュータではネットワークではネットワーク上におかれているデータに制限がありました。また、数自体それほど多くなかったことからある特定の人間だけ使えればいいという状況だったのです。
しかし、現代においてはネットワークのインフラも整備され、誰でもインターネットにつなげるという状況、それに伴い情報量も増え目的の情報をみつけるのに手作業でのリンクをたどったり、人に聞いたりということではまず目的の情報を得るということに関しては妥当な手段ではないと考えられます。
それによりできたのがサーチエンジンです。 GoogleやYahooなど様々なサーチエンジンがあります。
確かにgoogleやyahooなどは大きなネットワーク(インターネット)上のデータを探すのには適している手段でしょう、がしかし、小さなネットワーク(イントラネット)に属しているデータを探すのには、すこし問題点があることも事実です
例えば、イントラネット上の情報がインターネットには公開されていない場合はどうしようもありませんし、公開したとしてもその情報がアクティブになるまでには時間がかかります。
ちなみに、この情報というのはWordなどの文書情報に限った話ではありません。PowerPoint,Excel,メール,HTML文書,プロキシサーバのキャッシュなどのデータとしてあるものということになります。
と、なると、個人ベース、団体ベースでのプライベートな検索エンジンが必要になります。 自分でhtmlで作ってもかまいません。 ですが、できる範囲は限られていてそれをしようと思うと大変な労力になります。
それをかわって一つのツールがNamazuという全文検索のツールです。
例えば、ある団体の文書をまとめて目的の文書を探すといったときにもプライベートな利用でもつかうことができます。
便利でしょ?
wakeonlanで電源をON!
リモートで電源をきらないといけない場合、電源をリモートで入れないといけない場合
そうそうないシチュエーションかもしれないですが、あると便利なそんな機能があります。
それは[wakeonlan] 前に書いた記事にあるかもしれないですが、一応書いておきます。
それじゃ、テストしている所をお見せします。(セキュリティ面を考慮して構成、及び、テスト結果には仮想のネットワークとしております)
luna-nokonpyuta:~ luna$ ping hostname1.ac.jp
PING hostname1.ac.jp (157.13.61.1): 56 data bytes
64 bytes from 157.13.61.1: icmp_seq=0 ttl=42 time=71.771 ms
64 bytes from 157.13.61.1: icmp_seq=1 ttl=42 time=73.674 ms
64 bytes from 157.13.61.1: icmp_seq=2 ttl=42 time=65.395 ms
^C
--- hostname1.ac.jp ping statistics ---
3 packets transmitted, 3 packets received, 0% packet loss
round-trip min/avg/max/stddev = 65.395/70.280/73.674/3.541 ms
luna-nokonpyuta:~ luna$
これは、目的とするサーバと同一セグメント上にあるコンピュータに対してpingを飛ばし、動作しているかを確認しています。
次はあるセグメント上のコンピュータに入ってwakeonlanというコマンドを打ち込んでMacアドレスを打ち込めばOKというわけです。
このwakeonlanというコマンドですが、magicパケットを出してくれるものであればなんでもかまいません。知っている限り、perl,rubyなど様々言語で書かれたプログラムがありますので探してみてください。 ちなみに、私はwakeonlanっていうもろそのままなプログラムがありましたのでそれを使いました。
動作状況を書いてしまうと怒られそうなのであえて伏せて書きました。
というわけで、wakeonlanはおしまいです。
不必要な項目
最近心に潤いがない、思いやりっていうことを忘れている。
そんな貴方にいいページがあります。
育児板・泣いた話
思い出してホローリくる家族との思い出話
泣きそうになりそうでした。
そうそうないシチュエーションかもしれないですが、あると便利なそんな機能があります。
それは[wakeonlan] 前に書いた記事にあるかもしれないですが、一応書いておきます。
- wakeonlanとは
- 使える条件
- wakeonlanに対応したネットワークカード、マザーボード
- wakeonlanの機能を有効にしていること
- 同一セグメント上にmagicパケットを配信する機能を持つコンピュータが存在し、かつ、使用可能であること。
それじゃ、テストしている所をお見せします。(セキュリティ面を考慮して構成、及び、テスト結果には仮想のネットワークとしております)
luna-nokonpyuta:~ luna$ ping hostname1.ac.jp
PING hostname1.ac.jp (157.13.61.1): 56 data bytes
64 bytes from 157.13.61.1: icmp_seq=0 ttl=42 time=71.771 ms
64 bytes from 157.13.61.1: icmp_seq=1 ttl=42 time=73.674 ms
64 bytes from 157.13.61.1: icmp_seq=2 ttl=42 time=65.395 ms
^C
--- hostname1.ac.jp ping statistics ---
3 packets transmitted, 3 packets received, 0% packet loss
round-trip min/avg/max/stddev = 65.395/70.280/73.674/3.541 ms
luna-nokonpyuta:~ luna$
これは、目的とするサーバと同一セグメント上にあるコンピュータに対してpingを飛ばし、動作しているかを確認しています。
次はあるセグメント上のコンピュータに入ってwakeonlanというコマンドを打ち込んでMacアドレスを打ち込めばOKというわけです。
このwakeonlanというコマンドですが、magicパケットを出してくれるものであればなんでもかまいません。知っている限り、perl,rubyなど様々言語で書かれたプログラムがありますので探してみてください。 ちなみに、私はwakeonlanっていうもろそのままなプログラムがありましたのでそれを使いました。
動作状況を書いてしまうと怒られそうなのであえて伏せて書きました。
というわけで、wakeonlanはおしまいです。
不必要な項目
最近心に潤いがない、思いやりっていうことを忘れている。
そんな貴方にいいページがあります。
育児板・泣いた話
思い出してホローリくる家族との思い出話
泣きそうになりそうでした。
登録:
投稿 (Atom)