原生生物図鑑 | 関連情報 | 研究資料館 | Internetと生命科学
Googleを利用した

採集地ごとの生息情報


研究資料館では,サンプルごとにWebPageが作られていますが,各WebPageには画像とともに その採集地の情報もあります。そこで,Googleによるサイト内検索サービスを利用して採集地ごとの サンプル検索を行えるようにしてみました。
 表中の各都道府県名の下にある数値はGoogleで各地域名ごとにヒットする件数 を示しています。これらの合計は23,660(2006.01.13現在)となります ()。
 ちなみに,これまでのヒット件数は 6,400(2004.2.27), 8,922(2005.1.5), 9,237(2005.3.3) , 10,800(2005.4.13), 23,952(2005.10.19), 25,950(2005.12.27) となっています。 全体としては検索されるデータ量は徐々に増えていますが (今回は微減), 各地域ごとのヒット件数は,ときおり前の回に比べて減ることがあります。 実際のデータ量は増加速度の速い遅いはあっても,途中で減少することはありませんので, Googleは当データベースの内容を完全には収集しきれておらず,索引の更新のたびに一部が 欠落することもあると思われます。

北海道
308
青森県
67
岩手県
27
秋田県
25
宮城県
108
山形県
254
福島県
391
新潟県
207
茨城県
252
栃木県
582
群馬県
388
埼玉県
17,200
千葉県
422
東京都
870
神奈川県
53
山梨県
31
長野県
801
静岡県
45
富山県
52
石川県
172
福井県
76
愛知県
106
滋賀県
257
京都府
5
兵庫県
140
岡山県
161
広島県
192
山口県
186
香川県
42
高知県
33
福岡県
207
鹿児島県
19
沖縄県
-
     
米 国
284
台 湾
69
ウルグアイ
756
ドイツ
67
チェコ共和国
37
 

 Googleによる各地域名ごとにヒットする件数の合計は25,950(2005.12.27現在)ですが, これは,現在のサンプル数(11,916)の約2倍になります。
 当データベースは,各サンプルごとにWeb pageを作成していますので,サンプルごとのWeb pageの 数は,現在のサンプル数を越えないはずですが,ヒット数が2倍になってしまう原因はつぎのように 考えられます。
 まず,Web pageには,各サンプルごとのWeb page以外にそれらをまとめた種ごとのWeb pagesがあります。 種ごとのWeb pagesの数は現在,おおよそ2500個あり,これらのWeb pagesにも採集地の県名が記載 してありますので,それらも同時に検索されます。
 しかし,それらを足してもまだサンプル数の2倍にはなりませんので,残された原因は,Google側に あるのかも知れません。すなわち,集計したデータが重複(以前に収集したものと新規のもの)して いて一部が多めに計算されているのかも知れません。