[アルゴリズム]の検索結果
「MeCab」は 京都大学情報学研究科 日本電信電話株式会社コミュニケーション科学基礎研究所共同研究ユニットプロジェクトを通じて開発されたオープンソース形態素解析エンジン。フリーソフトウェア、GPL(the GNU General Public License), LGPL(Lesser GNU General Public License)、または BSD ライセンスに従って使用、再配布することができる。
MeCabの特徴
MeCab: Yet Another Part-of-Speech and Morphological Analyzer
一般ユーザ向けメーリングリスト
開発者向けメーリングリスト
MeCabの特徴
- 辞書、コーパスに依存しない汎用的な設計
- 条件付き確率場(Conditional Random Fields, CRF)に基づく高い解析精度
- ChaSen や KAKASI に比べ高速
- 辞書引きアルゴリズム/データ構造に、 高速な TRIE 構造である Double-Arrayを採用
- 再入可能なライブラリ
- 各種スクリプト言語バインディング(perl/ruby/python/java/C#)
MeCab: Yet Another Part-of-Speech and Morphological Analyzer
一般ユーザ向けメーリングリスト
開発者向けメーリングリスト
プログラムなどでよく使用されるアルゴリズムについて紹介しているサイト。
2007/10/31のYahoo!インデックス更新以降、トップページの検索順位が下がる現象が発生しているようですが、その原因はYahoo!の検索エンジン「YST」では不具合ではないかということです。
YSTのバグ
検索結果で確認してみるこのサイトも階層と順位が逆転しているようなのでひとごとではなさそうです。下の階層にブログがあってブログの方の被リンクや更新頻度が高いので、階層が低いページの順位が高いのはしょうがないのですが、Yahoo!経由でのアクセス数が激減しているので何とかしたいところです。
不具合の条件としてクロール(更新)の頻度が影響しているのではないかということなので、とりあえず以下の対策を行なってみました。
これでなんとかなってくれればよいのですが・・・
ヤフーのトップページ下落ペナルティ(TDP)の確認法 - 1000番目にも出てこない意味
Yahoo!の検索結果が意図的に操作されているというのであればどうしようもないのは言うまでもありません。
YSTのバグ
どうもYSTでは、階層と順位が逆転したときにはアルゴリズムに沿って正しいサイトの評価がされない可能性がある。基本的に各検索エンジンのアルゴリズムの中身は、それぞれの会社が決定権を持つことであるから、それによって下層ページが上層ページよりも評価が高くなったとしてもそれ自体には外部のものが口を挟む問題ではない。しかし、明らかに関連する数値に誤りがある以上は是正を行うべき余地が有ると考える。
検索結果で確認してみるこのサイトも階層と順位が逆転しているようなのでひとごとではなさそうです。下の階層にブログがあってブログの方の被リンクや更新頻度が高いので、階層が低いページの順位が高いのはしょうがないのですが、Yahoo!経由でのアクセス数が激減しているので何とかしたいところです。
ただ、通常Dのように評価の低いページがCよりも高い評価を受けることは考えにくい。ではどのような場合が問題となるのであろうか。これに関しては幾つかの可能性を留保するという前提つきであるが、更新頻度の高さが関係しているように思える。例えば物品販売系や情報系のサイトであれば新着情報や場合によってはサイトマップ、ブログなどであればフィードなどもこれに含まれる。これらはサイト内のどこが更新されようともそれに伴って更新されるからである。そしてその分クロールの頻度も高いであろうし、SEOに関心のあるサイトであればロボット用のサイトマップなどで更新を知らせているのであろうから更に頻度は高くなって当然であろう。
不具合の条件としてクロール(更新)の頻度が影響しているのではないかということなので、とりあえず以下の対策を行なってみました。
- トップページをブログの更新と連動して動的に更新されるようにする。
- サイトマップのchangefreq、priorityを変更しトップページのクロール頻繁、優先度を上げる。
これでなんとかなってくれればよいのですが・・・
ヤフーのトップページ下落ペナルティ(TDP)の確認法 - 1000番目にも出てこない意味
Yahoo!の検索結果が意図的に操作されているというのであればどうしようもないのは言うまでもありません。
低俗なニュースが多いことに悩み、ポイントの加算方法が変更されたばかりのソーシャルニュースサイト「newsing(ニューシング)」が、ピックアップされた記事に対してユーザーが「読む価値なし」という意思表示をする...
コンピュータのアーキテクチャや仕組みに関する書籍。コンピュータはなぜ動くのか?知っておきたいハードウエア&ソフトウエアの基礎知識?「アルゴリズム」「オブジェクト指向」「データベース」「ネットワーク」「セ...
プログラミング言語CC言語のバイブル。アメリカのANSI標準規格により定義されたC言語について解説されている。猫でもわかるC言語プログラミングC言語やプログラミングそのものがまったく初めてという人を対象に、コン...
アマゾンアソシエイトプログラムのリンク作成タイプに、希望の色や広告サイズを選択し、作成されたコードをWebサイトに貼り付けるだけで、Webサイトの内容に連動した商品が自動的に表示される「Amazonおまかせリンク...
プログラミング言語C++に関する書籍。基礎的な知識からC++プログラミングをマスターする入門書や実践的な解説書、リファレンスなど。Visual C++ (1)クラスの機能やMFCを使わずに、Visual C++のC言語機能だけを使用。...
2006年4月13日前後を境にYahoo!(YST)での検索結果の表示順位に変動があるようです。YST今回の変動に関する考察日本だけの現象ではないようですね。確かに「:」を付けるか付けないかによって検索結果に表示される内容...
+
A ドナルド・E・クヌース
コンピュータ処理に関する基本アルゴリズムを体系化するとともに、準数値アルゴリズムとしてコンピュータの内部演算と調和する数値計算の算法を確立し、コンピュータアルゴリズムの基礎を築いた。TEXの開発者としても...
アクセスランキング
今日のアクセスランキング TOP 10
- SQLのSELECT文で先頭から上位(TOP)10件のレコードを取得する方法(SQL Server、Oracle、MySQL、PostgreSQL) (61 PV)
- Google Finance(グーグルファイナンス)- リアルタイム株価情報、金融ニュース、日本株 (5 PV)
- SQLiteのSELECT文で上位 (TOP) n件のデータを取得する (4 PV)
- [FX]相場の上げ下げに応じて自動売買するMT4向け高勝率無料EA「IKEIKE」 #システムトレード #指標トレード (4 PV)
- MySQLのUPDATE文でLIMIT句を使用して上位3件のレコードを更新する (3 PV)
- 「xVideoServiceThief」無料の動画ダウンロードツール (3 PV)
- [FX]裁量ポジションを簡単に管理できるMT4向け無料EA「PositionKeeper」 (2 PV)
- MT4向けオープンソースナンピンマーチンEA「Automaton」 (2 PV)
- [Perl]メールフォームCGIの作り方 (2 PV)
- 2chまとめサイト - 痛いニュース(ノ∀`) (2 PV)
今月のアクセスランキング TOP 10
- SQLのSELECT文で先頭から上位(TOP)10件のレコードを取得する方法(SQL Server、Oracle、MySQL、PostgreSQL) (1854 PV)
- 安全性重視の完全無料ナンピンマーチンEA「Million Dollar(ミリオンダラー)」 #FX #ゴールド #ビットコイン (300 PV)
- Google Finance(グーグルファイナンス)- リアルタイム株価情報、金融ニュース、日本株 (255 PV)
- MT4向けオープンソースナンピンマーチンEA「Automaton」 (146 PV)
- 自作のMT4向け無料EA(口座縛り無し、ブローカー縛り無し、使用期限無し)とゴゴジャン出品中の有料EAの一覧 #MT4 (143 PV)
- 完全無料のMT5用ナンピンEA「Nanpin K(ナンピンケイ) MT5」 (139 PV)
- [FX]高値更新・安値更新でエントリー、MT4向け無料スキャルピングEA「1Scalper」#システムトレード (136 PV)
- MT4向け1ポジアノマリーEA「DAY TRADING」オープンソースライセンス(GPL3)で公開 #ドル円 (125 PV)
- 完全無料のMT4向けナンピンEA「Nanpin K(ナンピンケイ)」 (112 PV)
- SQLiteのSELECT文で上位 (TOP) n件のデータを取得する (109 PV)
アクセス統計
ディレクトリ
関連サイト