[変換ツール]の検索結果


Unicodeエスケープシーケンスは、\uXXXX(Xは十六進)の6バイトの形でUnicodeの1文字が表される文字の表記方法で、例えば、「あ」という文字はUnicodeエスケープシーケンスで「\u3042」と表記される。

Unicode エスケープシーケンス 変換
Unicodeエスケープシーケンス変換ツール
C++でunicode escape sequenceをutf8にする
[2322] Posted by kagahiro at 2013/07/01 17:23:39
0 point | Link (1) | Trackback (0) | Comment (0)

Unicodeの文字コード表によるとUTF-8の半角英数、全角英数、半角カナ、全角カナの文字コードは以下のようになるようです。 英数字の場合は半角と全角の文字がそれぞれ対応していますが、カタカナの場合は半角と全角では文字の数が違うようです。

半角数字:0 - 9
30 - 39

全角数字
EFBC90 - EFBC99
2バイト目まではEFBC

半角アルファベット大文字:A - Z
41 - 5A

全角アルファベット大文字:A - Z
EFBCA1 - EFBCBA
2バイト目まではEFBC

半角アルファベット小文字:a - z
61 - 7A

全角アルファベット小文字:a - z
EFBD80 - EFBD9A
2バイト目まではEFBD

半角カナ(JISカナ)
EFBDA1 - EFBE9F
1バイト目がEFで2バイト目、3バイト目がBDA1 - BE9Fの範囲

全角カタカナ
E38299 - E383BF
1バイト目がE3で2バイト目、3バイト目が82A1 - 83BFの範囲

Unicode対応 文字コード表
http://ash.jp/code/unitbl1.htm
http://ash.jp/code/unitbl21.htm

動作確認用にまずUTF-8の文字コードを表示するプログラムを作成します。

#!/usr/bin/perl

use strict;
use warnings;
use Encode;

my $hanAlnum = "ABCDE12345abcde";
my $zenAlnum = "ABCDE12345abcde";
my $hanKana = "アイウエオ";
my $zenKana = "アイウエオ";

print_charcode($hanAlnum);
print "\n";

print_charcode($zenAlnum);
print "\n";

print_charcode($hanKana);
print "\n";

print_charcode($zenKana);
print "\n";

# UTF-8でエンコードされた文字列の文字コードを表示する
sub print_charcode {
    my ($src) = @_;

    my $srclen = length($src);
    my $pos = 0;

    while ($pos < $srclen) {
        my $code = ord substr($src, $pos, 1); # 先頭のASCIIコード値を取得
        my $bytelen = _bytesize($code);
        my $srcchar = substr($src, $pos, $bytelen);
        my $codestr = sprintf("%2.2X ", $code);
        if ($bytelen > 1) {
            my $times = $bytelen - 1;
            for my $i (1 .. $times) {
                my $charcode = ord substr($src, $pos + $i, 1);
                $codestr .= sprintf("%2.2X ", $charcode);
            }
        }

        # Windowsで表示するのでcp932(シフトJIS)に変換
        Encode::from_to($srcchar, 'utf8', 'cp932');
        print "$srcchar : $codestr\n";
        $pos += $bytelen;
    }
}

# 文字のバイト長を求める
sub _bytesize {
    my $code = shift;
    my $size = 1;
    if (0x80 & $code) { # 1バイト文字以外
        $code <<= 1;
        for my $i (2 .. 8) {
            $size++;
            $code <<= 1;
            last if (!(0x80 & $code));
        }
    }
    return $size;
}

Perl Hacks ―プロが教えるテクニック & ツール101選
オライリー・ジャパン 著者:chromatic,Damian Conway,Curtis "Ovid" Poe


amazon.co.jpのカスタマーレビューを見る
powered by amalink

[2248] Posted by kagahiro at 2012/12/17 00:25:00
0 point | Link (1) | Trackback (0) | Comment (0)

自然言語処理(しぜんげんごしょり、natural language processing、NLP)は、人間が日常的に使っている自然言語をコンピュータに処理させる一連の技術であり、人工知能と言語学の一分野。「計算言語学」(computational linguistics)も同じ意味だが、自然言語処理が工学的な視点からの言語処理をさすのに対して、計算言語学は言語学的視点を重視する手法をさす事が多い。データベース内の情報を自然言語に変換したり、自然言語の文章をより形式的な(コンピュータが理解しやすい)表現に変換するといった処理が含まれる。

自然言語処理の基礎技術にはさまざまなものがあるが、現在のところ、日本語を処理する基礎技術としては、形態素解析、構文解析、語義の曖昧性解消照応解析が主に研究されている。

自然言語処理 - Wikipedia
言語処理学会 The Association for Natural Language Processing
自然言語処理ツール
Python による日本語自然言語処理
Perl で自然言語処理

入門 自然言語処理
オライリージャパン 著者:Steven Bird,Ewan Klein,Edward Loper


amazon.co.jpのカスタマーレビューを見る
powered by amalink

[2240] Posted by kagahiro at 2012/12/09 22:59:04
0 point | Link (1) | Trackback (0) | Comment (0)

xVideoServiceThief とはxVideoServiceThiefは、YouTube、USTREAM、Yahoo! Video、YourFileHostなど様々な動画共有サイトの動画を、AVI、WMV、MPEG1、MPEG2、MP4、MP4 HD、3GP、MP3形式またはApple iPod、Sony PSP用...
[2168] Posted by kagahiro at 2012/04/18 16:49:35
0 point | Link (7) | Trackback (0) | Comment (0)

Twitterのつぶやきを見ていると、どこかのサイトのコンテンツを紹介するソーシャルブックマーク的な使い方が多いのですが、こうしてみるとTwitterもブログソーシャルブックマークも役割的には似たようなものですね...
[1392] Posted by kagahiro at 2009/10/17 18:52:24
0 point | Link (2) | Trackback (0) | Comment (0)

フロントラインが、ワンクリックでYouTubeの動画をダウンロードし、PCやiPhone、iPod touch、iPod nano等で再生できるYouTubeダウンロードソフト「YouTube2iPod」を、2008年10月10日に発売する。ファイル形式の変換機...
[1216] Posted by kagahiro at 2008/09/09 22:42:22
0 point | Link (2) | Trackback (0) | Comment (0)

ようつべ(YouTube)の動画をダウンロードしてファイルに保存できるオンラインサービスとソフトウェア無料でようつべ(YouTube)などの動画共有サイトの動画ダウンロードしてパソコンにファイルとして保存できるオン...
[1103] Posted by kagahiro at 2007/10/29 03:16:25
2 point | Link (9) | Trackback (1) | Comment (1)

アップルがiPod touch(アイポッドタッチ)、iPhoneで利用できるサードパーティ製のWebアプリケーションを集めた公式ディレクトリを公開した。エンターテインメント、ゲーム、ニュース、検索ツール、ソーシャルネット...
(追記あり)
[1089] Posted by kagahiro at 2007/10/14 00:29:24
0 point | Link (4) | Trackback (0) | Comment (0)

急速な成長をみせる注目の動画共有サイト「YouTube(ようつべ、ユーチューブ)」は、すでに多大な収益を上げながらなおも成長を続けるグーグルのようになれるのかYouTube(ようつべ)の急速なアクセス増加に刺激を受け...
(追記あり)
[731] Posted by kagahiro at 2006/07/08 19:46:33
3 point | Link (9) | Trackback (3) | Comment (0)

マイクロソフトが、Oracle Database をベースとしたパッケージ製品やソリューションからMicrosoft SQL Server 2005 への移行を検討している ISV、 SI 企業の支援を目的に、移行の検証支援、ファシリティ、及び移行ツ...
[644] Posted by kagahiro at 2006/06/20 07:53:07
0 point | Link (1) | Trackback (0) | Comment (0)

  1 2  次へ >


アクセスランキング

今日のアクセスランキング TOP 10

  1. FC2まとめ (5 PV)
  2. SQLのSELECT文で先頭から上位(TOP)10件のレコードを取得する方法(SQL Server、Oracle、MySQL、PostgreSQL) (4 PV)
  3. Twitter Lite - 起動時や利用時の読み込み速度が最大30%アップ (3 PV)
  4. 2ちゃんねる(2ch) (3 PV)
  5. 大人気のブランド品即時買取サービス「CASH」がDMM.comにたったの70億円で買い叩かれる (2 PV)
  6. 無料ダイヤルアッププロバイダ「Soloot(ソルート)」 (2 PV)
  7. FC2ブログにコミュニティ機能 (2 PV)
  8. ほしい物リスト (2 PV)
  9. Hg Init: a Mercurial tutorial by Joel Spolsky (2 PV)
  10. 掲示板CGI ThreadPlus 1.2 のリリース (2 PV)

今月のアクセスランキング TOP 10

  1. FC2まとめ (13 PV)
  2. 将棋ウォーズPCブラウザ版がchrome、Firefox、edgeなどに対応 (8 PV)
  3. SQLのSELECT文で先頭から上位(TOP)10件のレコードを取得する方法(SQL Server、Oracle、MySQL、PostgreSQL) (7 PV)
  4. 掲示板CGI ThreadPlus 1.2 のリリース (5 PV)
  5. 「Kindle for the Web」 (5 PV)
  6. FC2ブログにコミュニティ機能 (4 PV)
  7. Jipanguの配布は終了しました (4 PV)
  8. [FX]裁量ポジションを簡単に管理できるMT4向け無料の裁量補助EA「PositionKeeper」 (4 PV)
  9. Twitter Lite - 起動時や利用時の読み込み速度が最大30%アップ (3 PV)
  10. 「さくらのクラウド」のオプションサービスで「専有ホスト」の提供を開始 (3 PV)

アクセス統計

ディレクトリ

関連サイト