[ツール]の検索結果
Unicodeの文字コード表によるとUTF-8の半角英数、全角英数、半角カナ、全角カナの文字コードは以下のようになるようです。 英数字の場合は半角と全角の文字がそれぞれ対応していますが、カタカナの場合は半角と全角では文字の数が違うようです。
半角数字:0 - 9
30 - 39
全角数字
EFBC90 - EFBC99
2バイト目まではEFBC
半角アルファベット大文字:A - Z
41 - 5A
全角アルファベット大文字:A - Z
EFBCA1 - EFBCBA
2バイト目まではEFBC
半角アルファベット小文字:a - z
61 - 7A
全角アルファベット小文字:a - z
EFBD80 - EFBD9A
2バイト目まではEFBD
半角カナ(JISカナ)
EFBDA1 - EFBE9F
1バイト目がEFで2バイト目、3バイト目がBDA1 - BE9Fの範囲
全角カタカナ
E38299 - E383BF
1バイト目がE3で2バイト目、3バイト目が82A1 - 83BFの範囲
Unicode対応 文字コード表
http://ash.jp/code/unitbl1.htm
http://ash.jp/code/unitbl21.htm
動作確認用にまずUTF-8の文字コードを表示するプログラムを作成します。
#!/usr/bin/perl
use strict;
use warnings;
use Encode;
my $hanAlnum = "ABCDE12345abcde";
my $zenAlnum = "ABCDE12345abcde";
my $hanKana = "アイウエオ";
my $zenKana = "アイウエオ";
print_charcode($hanAlnum);
print "\n";
print_charcode($zenAlnum);
print "\n";
print_charcode($hanKana);
print "\n";
print_charcode($zenKana);
print "\n";
# UTF-8でエンコードされた文字列の文字コードを表示する
sub print_charcode {
my ($src) = @_;
my $srclen = length($src);
my $pos = 0;
while ($pos < $srclen) {
my $code = ord substr($src, $pos, 1); # 先頭のASCIIコード値を取得
my $bytelen = _bytesize($code);
my $srcchar = substr($src, $pos, $bytelen);
my $codestr = sprintf("%2.2X ", $code);
if ($bytelen > 1) {
my $times = $bytelen - 1;
for my $i (1 .. $times) {
my $charcode = ord substr($src, $pos + $i, 1);
$codestr .= sprintf("%2.2X ", $charcode);
}
}
# Windowsで表示するのでcp932(シフトJIS)に変換
Encode::from_to($srcchar, 'utf8', 'cp932');
print "$srcchar : $codestr\n";
$pos += $bytelen;
}
}
# 文字のバイト長を求める
sub _bytesize {
my $code = shift;
my $size = 1;
if (0x80 & $code) { # 1バイト文字以外
$code <<= 1;
for my $i (2 .. 8) {
$size++;
$code <<= 1;
last if (!(0x80 & $code));
}
}
return $size;
}
Perl Hacks ―プロが教えるテクニック & ツール101選
オライリー・ジャパン 著者:chromatic,Damian Conway,Curtis "Ovid" Poe
amazon.co.jpのカスタマーレビューを見る
powered by amalink
自然言語処理(しぜんげんごしょり、natural language processing、NLP)は、人間が日常的に使っている自然言語をコンピュータに処理させる一連の技術であり、人工知能と言語学の一分野。「計算言語学」(computational linguistics)も同じ意味だが、自然言語処理が工学的な視点からの言語処理をさすのに対して、計算言語学は言語学的視点を重視する手法をさす事が多い。データベース内の情報を自然言語に変換したり、自然言語の文章をより形式的な(コンピュータが理解しやすい)表現に変換するといった処理が含まれる。
自然言語処理の基礎技術にはさまざまなものがあるが、現在のところ、日本語を処理する基礎技術としては、形態素解析、構文解析、語義の曖昧性解消照応解析が主に研究されている。
自然言語処理 - Wikipedia
言語処理学会 The Association for Natural Language Processing
自然言語処理ツール
Python による日本語自然言語処理
Perl で自然言語処理
入門 自然言語処理
オライリージャパン 著者:Steven Bird,Ewan Klein,Edward Loper
amazon.co.jpのカスタマーレビューを見る
powered by amalink
利用料金は、初期費用:2,100円(税込)、月額費用:6,720円~(税込)。サービス提供開始記念キャンペーンとして、2012年10月4日 正午から2012年12月28日正午まで申し込みしたユーザーを対象に、初期費用、及び月額費用最大3ヶ月間を無料とするキャンペーンが実施される。
「お名前.com デスクトップクラウド for Windowsアプリ」は、開発者がWindows 8 やスマートフォンなどの様々なデバイスに対応したアプリケーションを開発する際、開発用にPC環境やソフトウェアを準備することなく、コストを抑えてすぐに開発を始められるクラウド型の開発環境で、Windows アプリケーション開発者だけでなく、AndroidやiOSなど他のプラットフォームでアプリケーション開発者なども、Windows 8の新しいユーザーインターフェイスやマルチタッチなどを活用してアプリケーションを容易に開発できる。また、クラウド型の開発環境であることから、インターネットにアクセスできる環境であれば、MacなどWindows以外の端末からもいつでもどこでも同じ開発環境を利用できるという。
GMOインターネットと日本マイクロソフトが提携し、Windows(R)アプリケーションのクラウド型開発環境を世界で初めて提供
for Windowsアプリプラン | お名前.comデスクトップクラウド
Windows Phoneアプリ開発入門
秀和システム 著者:和田 健司
amazon.co.jpのカスタマーレビューを見る
powered by amalink
アクセスランキング
今日のアクセスランキング TOP 10
- [将棋]第66期王将戦七番勝負第6局で久保利明九段が郷田真隆王将に勝ち新王将に #王将戦 (5 PV)
- 電通のインサイダー取引疑惑 (3 PV)
- Twitterがウィルコム公式コンテンツに (3 PV)
- ブロードバンド普及率は41.4%に (3 PV)
- [政治と経済]デービッド・ロックフェラー死去、米ロックフェラー財閥の3代目当主 #陰謀論 #世界政府 (2 PV)
- Microsoft Cognitive Toolkit - オープンソースの深層学習ツールキット#機械学習 #プログラミング (2 PV)
- オープンソースの将来に影を落とす買収の脅威 (2 PV)
- ETF(Exchange Traded Funds)とは #金融商品 #投資 (2 PV)
- [経済]格安旅行業者「てるみくらぶ」が破産 #Yahoo!ニュース (2 PV)
- 誰もミラートレードはできない人気FX系YouTubeチャンネル「ドラfx」 #ゼロカット不可避 (2 PV)
今月のアクセスランキング TOP 10
- SQLのSELECT文で先頭から上位(TOP)10件のレコードを取得する方法(SQL Server、Oracle、MySQL、PostgreSQL) (67 PV)
- 2NN 2ちゃんねるニュース速報+ナビ (54 PV)
- 仲値トレードが簡単にできる無料EA「NAKANE3」 #MT4 (38 PV)
- Google Finance(グーグルファイナンス)- リアルタイム株価情報、金融ニュース、日本株 (22 PV)
- Google News (グーグルニュース)日本版 (22 PV)
- 裁量トレードを半自動化する無料のMT5向け裁量トレード支援ツール(裁量補助EA)「PositionKeeper MT5」 #FX (21 PV)
- [PR]noteで販売している自作EAの一覧 (20 PV)
- MT4向け1ポジブレイクアウトEA「HEADLINE」オープンソースライセンス(GPL3)で公開 #USDJPY (18 PV)
- USTREAM(ユーストリーム) 日本語版 無料のライブ映像配信サービス (17 PV)
- MT4向け無料ヘッジ(両建て)ツール(EA)「STOPPER FREE」 #自動売買 #FX (17 PV)
アクセス統計
ディレクトリ
関連サイト




