[アルゴリズム]の検索結果
「MeCab」は 京都大学情報学研究科 日本電信電話株式会社コミュニケーション科学基礎研究所共同研究ユニットプロジェクトを通じて開発されたオープンソース形態素解析エンジン。フリーソフトウェア、GPL(the GNU General Public License), LGPL(Lesser GNU General Public License)、または BSD ライセンスに従って使用、再配布することができる。
MeCabの特徴
MeCab: Yet Another Part-of-Speech and Morphological Analyzer
一般ユーザ向けメーリングリスト
開発者向けメーリングリスト
MeCabの特徴
- 辞書、コーパスに依存しない汎用的な設計
- 条件付き確率場(Conditional Random Fields, CRF)に基づく高い解析精度
- ChaSen や KAKASI に比べ高速
- 辞書引きアルゴリズム/データ構造に、 高速な TRIE 構造である Double-Arrayを採用
- 再入可能なライブラリ
- 各種スクリプト言語バインディング(perl/ruby/python/java/C#)
MeCab: Yet Another Part-of-Speech and Morphological Analyzer
一般ユーザ向けメーリングリスト
開発者向けメーリングリスト
プログラムなどでよく使用されるアルゴリズムについて紹介しているサイト。
2007/10/31のYahoo!インデックス更新以降、トップページの検索順位が下がる現象が発生しているようですが、その原因はYahoo!の検索エンジン「YST」では不具合ではないかということです。
YSTのバグ
検索結果で確認してみるこのサイトも階層と順位が逆転しているようなのでひとごとではなさそうです。下の階層にブログがあってブログの方の被リンクや更新頻度が高いので、階層が低いページの順位が高いのはしょうがないのですが、Yahoo!経由でのアクセス数が激減しているので何とかしたいところです。
不具合の条件としてクロール(更新)の頻度が影響しているのではないかということなので、とりあえず以下の対策を行なってみました。
これでなんとかなってくれればよいのですが・・・
ヤフーのトップページ下落ペナルティ(TDP)の確認法 - 1000番目にも出てこない意味
Yahoo!の検索結果が意図的に操作されているというのであればどうしようもないのは言うまでもありません。
YSTのバグ
どうもYSTでは、階層と順位が逆転したときにはアルゴリズムに沿って正しいサイトの評価がされない可能性がある。基本的に各検索エンジンのアルゴリズムの中身は、それぞれの会社が決定権を持つことであるから、それによって下層ページが上層ページよりも評価が高くなったとしてもそれ自体には外部のものが口を挟む問題ではない。しかし、明らかに関連する数値に誤りがある以上は是正を行うべき余地が有ると考える。
検索結果で確認してみるこのサイトも階層と順位が逆転しているようなのでひとごとではなさそうです。下の階層にブログがあってブログの方の被リンクや更新頻度が高いので、階層が低いページの順位が高いのはしょうがないのですが、Yahoo!経由でのアクセス数が激減しているので何とかしたいところです。
ただ、通常Dのように評価の低いページがCよりも高い評価を受けることは考えにくい。ではどのような場合が問題となるのであろうか。これに関しては幾つかの可能性を留保するという前提つきであるが、更新頻度の高さが関係しているように思える。例えば物品販売系や情報系のサイトであれば新着情報や場合によってはサイトマップ、ブログなどであればフィードなどもこれに含まれる。これらはサイト内のどこが更新されようともそれに伴って更新されるからである。そしてその分クロールの頻度も高いであろうし、SEOに関心のあるサイトであればロボット用のサイトマップなどで更新を知らせているのであろうから更に頻度は高くなって当然であろう。
不具合の条件としてクロール(更新)の頻度が影響しているのではないかということなので、とりあえず以下の対策を行なってみました。
- トップページをブログの更新と連動して動的に更新されるようにする。
- サイトマップのchangefreq、priorityを変更しトップページのクロール頻繁、優先度を上げる。
これでなんとかなってくれればよいのですが・・・
ヤフーのトップページ下落ペナルティ(TDP)の確認法 - 1000番目にも出てこない意味
Yahoo!の検索結果が意図的に操作されているというのであればどうしようもないのは言うまでもありません。
低俗なニュースが多いことに悩み、ポイントの加算方法が変更されたばかりのソーシャルニュースサイト「newsing(ニューシング)」が、ピックアップされた記事に対してユーザーが「読む価値なし」という意思表示をする...
コンピュータのアーキテクチャや仕組みに関する書籍。コンピュータはなぜ動くのか?知っておきたいハードウエア&ソフトウエアの基礎知識?「アルゴリズム」「オブジェクト指向」「データベース」「ネットワーク」「セ...
プログラミング言語CC言語のバイブル。アメリカのANSI標準規格により定義されたC言語について解説されている。猫でもわかるC言語プログラミングC言語やプログラミングそのものがまったく初めてという人を対象に、コン...
アマゾンアソシエイトプログラムのリンク作成タイプに、希望の色や広告サイズを選択し、作成されたコードをWebサイトに貼り付けるだけで、Webサイトの内容に連動した商品が自動的に表示される「Amazonおまかせリンク...
プログラミング言語C++に関する書籍。基礎的な知識からC++プログラミングをマスターする入門書や実践的な解説書、リファレンスなど。Visual C++ (1)クラスの機能やMFCを使わずに、Visual C++のC言語機能だけを使用。...
2006年4月13日前後を境にYahoo!(YST)での検索結果の表示順位に変動があるようです。YST今回の変動に関する考察日本だけの現象ではないようですね。確かに「:」を付けるか付けないかによって検索結果に表示される内容...
+
A ドナルド・E・クヌース
コンピュータ処理に関する基本アルゴリズムを体系化するとともに、準数値アルゴリズムとしてコンピュータの内部演算と調和する数値計算の算法を確立し、コンピュータアルゴリズムの基礎を築いた。TEXの開発者としても...
アクセスランキング
今日のアクセスランキング TOP 10
- FC2まとめ (5 PV)
- SQLのSELECT文で先頭から上位(TOP)10件のレコードを取得する方法(SQL Server、Oracle、MySQL、PostgreSQL) (4 PV)
- Twitter Lite - 起動時や利用時の読み込み速度が最大30%アップ (3 PV)
- 2ちゃんねる(2ch) (3 PV)
- 大人気のブランド品即時買取サービス「CASH」がDMM.comにたったの70億円で買い叩かれる (2 PV)
- 無料ダイヤルアッププロバイダ「Soloot(ソルート)」 (2 PV)
- FC2ブログにコミュニティ機能 (2 PV)
- ほしい物リスト (2 PV)
- Hg Init: a Mercurial tutorial by Joel Spolsky (2 PV)
- 掲示板CGI ThreadPlus 1.2 のリリース (2 PV)
今月のアクセスランキング TOP 10
- FC2まとめ (13 PV)
- 将棋ウォーズPCブラウザ版がchrome、Firefox、edgeなどに対応 (8 PV)
- SQLのSELECT文で先頭から上位(TOP)10件のレコードを取得する方法(SQL Server、Oracle、MySQL、PostgreSQL) (7 PV)
- 掲示板CGI ThreadPlus 1.2 のリリース (5 PV)
- 「Kindle for the Web」 (5 PV)
- FC2ブログにコミュニティ機能 (4 PV)
- Jipanguの配布は終了しました (4 PV)
- [FX]裁量ポジションを簡単に管理できるMT4向け無料の裁量補助EA「PositionKeeper」 (4 PV)
- Twitter Lite - 起動時や利用時の読み込み速度が最大30%アップ (3 PV)
- 「さくらのクラウド」のオプションサービスで「専有ホスト」の提供を開始 (3 PV)
アクセス統計
ディレクトリ
関連サイト