[ツール]の検索結果
Unicodeの文字コード表によるとUTF-8の半角英数、全角英数、半角カナ、全角カナの文字コードは以下のようになるようです。 英数字の場合は半角と全角の文字がそれぞれ対応していますが、カタカナの場合は半角と全角では文字の数が違うようです。
半角数字:0 - 9
30 - 39
全角数字
EFBC90 - EFBC99
2バイト目まではEFBC
半角アルファベット大文字:A - Z
41 - 5A
全角アルファベット大文字:A - Z
EFBCA1 - EFBCBA
2バイト目まではEFBC
半角アルファベット小文字:a - z
61 - 7A
全角アルファベット小文字:a - z
EFBD80 - EFBD9A
2バイト目まではEFBD
半角カナ(JISカナ)
EFBDA1 - EFBE9F
1バイト目がEFで2バイト目、3バイト目がBDA1 - BE9Fの範囲
全角カタカナ
E38299 - E383BF
1バイト目がE3で2バイト目、3バイト目が82A1 - 83BFの範囲
Unicode対応 文字コード表
http://ash.jp/code/unitbl1.htm
http://ash.jp/code/unitbl21.htm
動作確認用にまずUTF-8の文字コードを表示するプログラムを作成します。
#!/usr/bin/perl
use strict;
use warnings;
use Encode;
my $hanAlnum = "ABCDE12345abcde";
my $zenAlnum = "ABCDE12345abcde";
my $hanKana = "アイウエオ";
my $zenKana = "アイウエオ";
print_charcode($hanAlnum);
print "\n";
print_charcode($zenAlnum);
print "\n";
print_charcode($hanKana);
print "\n";
print_charcode($zenKana);
print "\n";
# UTF-8でエンコードされた文字列の文字コードを表示する
sub print_charcode {
my ($src) = @_;
my $srclen = length($src);
my $pos = 0;
while ($pos < $srclen) {
my $code = ord substr($src, $pos, 1); # 先頭のASCIIコード値を取得
my $bytelen = _bytesize($code);
my $srcchar = substr($src, $pos, $bytelen);
my $codestr = sprintf("%2.2X ", $code);
if ($bytelen > 1) {
my $times = $bytelen - 1;
for my $i (1 .. $times) {
my $charcode = ord substr($src, $pos + $i, 1);
$codestr .= sprintf("%2.2X ", $charcode);
}
}
# Windowsで表示するのでcp932(シフトJIS)に変換
Encode::from_to($srcchar, 'utf8', 'cp932');
print "$srcchar : $codestr\n";
$pos += $bytelen;
}
}
# 文字のバイト長を求める
sub _bytesize {
my $code = shift;
my $size = 1;
if (0x80 & $code) { # 1バイト文字以外
$code <<= 1;
for my $i (2 .. 8) {
$size++;
$code <<= 1;
last if (!(0x80 & $code));
}
}
return $size;
}
Perl Hacks ―プロが教えるテクニック & ツール101選
オライリー・ジャパン 著者:chromatic,Damian Conway,Curtis "Ovid" Poe
amazon.co.jpのカスタマーレビューを見る
powered by amalink
自然言語処理(しぜんげんごしょり、natural language processing、NLP)は、人間が日常的に使っている自然言語をコンピュータに処理させる一連の技術であり、人工知能と言語学の一分野。「計算言語学」(computational linguistics)も同じ意味だが、自然言語処理が工学的な視点からの言語処理をさすのに対して、計算言語学は言語学的視点を重視する手法をさす事が多い。データベース内の情報を自然言語に変換したり、自然言語の文章をより形式的な(コンピュータが理解しやすい)表現に変換するといった処理が含まれる。
自然言語処理の基礎技術にはさまざまなものがあるが、現在のところ、日本語を処理する基礎技術としては、形態素解析、構文解析、語義の曖昧性解消照応解析が主に研究されている。
自然言語処理 - Wikipedia
言語処理学会 The Association for Natural Language Processing
自然言語処理ツール
Python による日本語自然言語処理
Perl で自然言語処理
入門 自然言語処理
オライリージャパン 著者:Steven Bird,Ewan Klein,Edward Loper
amazon.co.jpのカスタマーレビューを見る
powered by amalink
利用料金は、初期費用:2,100円(税込)、月額費用:6,720円~(税込)。サービス提供開始記念キャンペーンとして、2012年10月4日 正午から2012年12月28日正午まで申し込みしたユーザーを対象に、初期費用、及び月額費用最大3ヶ月間を無料とするキャンペーンが実施される。
「お名前.com デスクトップクラウド for Windowsアプリ」は、開発者がWindows 8 やスマートフォンなどの様々なデバイスに対応したアプリケーションを開発する際、開発用にPC環境やソフトウェアを準備することなく、コストを抑えてすぐに開発を始められるクラウド型の開発環境で、Windows アプリケーション開発者だけでなく、AndroidやiOSなど他のプラットフォームでアプリケーション開発者なども、Windows 8の新しいユーザーインターフェイスやマルチタッチなどを活用してアプリケーションを容易に開発できる。また、クラウド型の開発環境であることから、インターネットにアクセスできる環境であれば、MacなどWindows以外の端末からもいつでもどこでも同じ開発環境を利用できるという。
GMOインターネットと日本マイクロソフトが提携し、Windows(R)アプリケーションのクラウド型開発環境を世界で初めて提供
for Windowsアプリプラン | お名前.comデスクトップクラウド
Windows Phoneアプリ開発入門
秀和システム 著者:和田 健司
amazon.co.jpのカスタマーレビューを見る
powered by amalink
アクセスランキング
今日のアクセスランキング TOP 10
- SQLのSELECT文で先頭から上位(TOP)10件のレコードを取得する方法(SQL Server、Oracle、MySQL、PostgreSQL) (15 PV)
- FC2まとめ (6 PV)
- 2ちゃんねる(2ch) (5 PV)
- StartPage(スタートページ) - 匿名検索エンジン (4 PV)
- Twitter Lite - 起動時や利用時の読み込み速度が最大30%アップ (3 PV)
- 「RPGツクールMV」製ゲームを簡単にiOS、Androidアプリ化する「Monaca for RPGツクール」 #テクノロジー (3 PV)
- Google 日本語入力がオープンソースに (3 PV)
- 大人気のブランド品即時買取サービス「CASH」がDMM.comにたったの70億円で買い叩かれる (2 PV)
- MT4向けヘッジEA「Balancer X Ver 1.01(使用期限 2022年06月30日 23時59分)」 #システムトレード (2 PV)
- 無料ダイヤルアッププロバイダ「Soloot(ソルート)」 (2 PV)
今月のアクセスランキング TOP 10
- SQLのSELECT文で先頭から上位(TOP)10件のレコードを取得する方法(SQL Server、Oracle、MySQL、PostgreSQL) (18 PV)
- FC2まとめ (14 PV)
- 将棋ウォーズPCブラウザ版がchrome、Firefox、edgeなどに対応 (8 PV)
- StartPage(スタートページ) - 匿名検索エンジン (5 PV)
- 掲示板CGI ThreadPlus 1.2 のリリース (5 PV)
- 「Kindle for the Web」 (5 PV)
- 2ちゃんねる(2ch) (5 PV)
- 電通が2ちゃんねるを監視 「電通バズリサーチ(Dentsu Buzz Research)」 (5 PV)
- FC2ブログにコミュニティ機能 (4 PV)
- MySQLのINSERT ... SELECT文でLIMIT句を使用して上位3件のレコードをテーブルに追加する (4 PV)
アクセス統計
ディレクトリ
関連サイト




