<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0">
 <channel>
  <title>語句ログ - ニュース、プログラミング、システムトレードの用語解説</title>
  <link>https://59log.com/</link>
  <description>日本の注目ニュース、コンピュータープログラミング（C/C++,Perl,PHP,SQL）、システムトレード（FX,CFD,株価指数,先物）に関する語句（Word）を日本語や英語で解説</description>
  <lastBuildDate>Sun, 03 May 2026 19:11:55 +0900</lastBuildDate>
  <pubDate>Sun, 03 May 2026 19:11:55 +0900</pubDate>
  <docs>http://blogs.law.harvard.edu/tech/rss</docs>
  <generator>59Tracker 3.2</generator>
  <item>
    <title>云々（でんでん、うんぬん）</title>
    <description>云々（でんでん、うんぬん）とは、引用した文や語句のあとを省略するときに、以下略の意で、その末尾に添える語で、以前は「うんぬん」と読まれていたが、安倍首相が国会答弁で「でんでん」と呼んだことで、権力者の発言に弱い日本では今後は「でんでん」と読まれることが多くなると思われる。&lt;br /&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;https://59log.com/?func=detail&amp;amp;id=2618#link&quot; target=&quot;_blank&quot;&gt;Link(1)&lt;/a&gt; | &lt;a href=&quot;https://59log.com/?func=detail&amp;amp;id=2618#trackback&quot; target=&quot;_blank&quot;&gt;Trackback(0)&lt;/a&gt; | &lt;a href=&quot;https://59log.com/?func=detail&amp;amp;id=2618#comment&quot; target=&quot;_blank&quot;&gt;Comment(0)&lt;/a&gt;&lt;br /&gt;&lt;p&gt;&lt;h3&gt;キーワード&lt;/h3&gt;&lt;p&gt;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=%E5%AE%89%E5%80%8D%E9%A6%96%E7%9B%B8&quot; title=&quot;安倍首相&quot;&gt;安倍首相&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=%E6%BC%A2%E5%AD%97&quot; title=&quot;漢字&quot;&gt;漢字&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=%E8%AA%AD%E3%81%BF&quot; title=&quot;読み&quot;&gt;読み&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=%E6%97%A5%E6%9C%AC%E8%AA%9E&quot; title=&quot;日本語&quot;&gt;日本語&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;/p&gt;&lt;/p&gt;&lt;p&gt;&lt;a href=&quot;https://59log.com/&quot;&gt;語句ログ - ニュース、プログラミング、システムトレードの用語解説 - 日本の注目ニュース、コンピュータープログラミング（C/C++,Perl,PHP,SQL）、システムトレード（FX,CFD,株価指数,先物）に関する語句（Word）を日本語や英語で解説&lt;/a&gt;&lt;/p&gt;</description>
    <link>https://59log.com/?func=detail&amp;id=2618</link>
    <pubDate>Thu, 26 Jan 2017 15:36:23 +0900</pubDate>
  </item>
  <item>
    <title>[C言語]UTF-8でエンコードされた文字列の部分文字列を取り出すコード</title>
    <description>&lt;p&gt;C言語のstrncpy関数やmemcpy関数ではバイト単位の操作になるので、漢字、ひらがな、カタカナなどの全角文字を文字数で指定して部分文字列を取り出すことができません。そこで半角英数も全角文字も1文字として部分文字列を取り出すことができる関数を作成します。&lt;/p&gt;&lt;p&gt;以下はそのコードです。&lt;a href=&quot;http://59log.com/?func=detail&amp;id=2323&quot;&gt;[C言語]UTF-8でエンコードされた文字列の文字数を取得するコード&lt;/a&gt;と同様に、文字の1バイト目のビットの状態を調べることによってその文字が何バイト文字を判定しています。&lt;/p&gt;&lt;p&gt;&lt;span class=&quot;src_preprocessor&quot;&gt;#include&amp;nbsp;&amp;lt;stdio.h&amp;gt;&lt;/span&gt;&lt;br&gt;&lt;span class=&quot;src_preprocessor&quot;&gt;#include&amp;nbsp;&amp;lt;string.h&amp;gt;&lt;/span&gt;&lt;br&gt;&lt;br&gt;&lt;span class=&quot;src_typekeyword&quot;&gt;char&lt;/span&gt;&amp;nbsp;*substr_utf8(&lt;span class=&quot;src_typekeyword&quot;&gt;char&lt;/span&gt;&amp;nbsp;*dest,&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;char&lt;/span&gt;&amp;nbsp;*src,&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;int&lt;/span&gt;&amp;nbsp;offset,&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;int&lt;/span&gt;&amp;nbsp;len);&lt;br&gt;&lt;span class=&quot;src_typekeyword&quot;&gt;int&lt;/span&gt;&amp;nbsp;_bytesize(&lt;span class=&quot;src_typekeyword&quot;&gt;unsigned&lt;/span&gt;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;char&lt;/span&gt;&amp;nbsp;code);&lt;br&gt;&lt;br&gt;&lt;br&gt;&lt;span class=&quot;src_typekeyword&quot;&gt;int&lt;/span&gt;&amp;nbsp;main(&lt;span class=&quot;src_keyword&quot;&gt;void&lt;/span&gt;)&lt;br&gt;{&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;char&lt;/span&gt;&amp;nbsp;*testStr&amp;nbsp;=&amp;nbsp;&lt;span class=&quot;src_doublequotation&quot;&gt;&amp;quot;ABCDEFGあいうえおアイウエオ愛夢佐々木&amp;quot;&lt;/span&gt;;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;char&lt;/span&gt;&amp;nbsp;strBuf[&lt;span class=&quot;src_digit&quot;&gt;256&lt;/span&gt;];&lt;br&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;memset(strBuf,&amp;nbsp;&lt;span class=&quot;src_digit&quot;&gt;0&lt;/span&gt;,&amp;nbsp;&lt;span class=&quot;src_keyword&quot;&gt;sizeof&lt;/span&gt;&amp;nbsp;strBuf);&lt;br&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;printf(&lt;span class=&quot;src_doublequotation&quot;&gt;&amp;quot;substr_utf8($testStr,&amp;nbsp;0,&amp;nbsp;5)&amp;nbsp;=&amp;nbsp;%s\n&amp;quot;&lt;/span&gt;,&amp;nbsp;substr_utf8(strBuf,&amp;nbsp;testStr,&amp;nbsp;&lt;span class=&quot;src_digit&quot;&gt;0&lt;/span&gt;,&amp;nbsp;&lt;span class=&quot;src_digit&quot;&gt;5&lt;/span&gt;));&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;printf(&lt;span class=&quot;src_doublequotation&quot;&gt;&amp;quot;substr_utf8($testStr,&amp;nbsp;3,&amp;nbsp;3)&amp;nbsp;=&amp;nbsp;%s\n&amp;quot;&lt;/span&gt;,&amp;nbsp;substr_utf8(strBuf,&amp;nbsp;testStr,&amp;nbsp;&lt;span class=&quot;src_digit&quot;&gt;3&lt;/span&gt;,&amp;nbsp;&lt;span class=&quot;src_digit&quot;&gt;3&lt;/span&gt;));&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;printf(&lt;span class=&quot;src_doublequotation&quot;&gt;&amp;quot;substr_utf8($testStr,&amp;nbsp;10,&amp;nbsp;4)&amp;nbsp;=&amp;nbsp;%s\n&amp;quot;&lt;/span&gt;,&amp;nbsp;substr_utf8(strBuf,&amp;nbsp;testStr,&amp;nbsp;&lt;span class=&quot;src_digit&quot;&gt;10&lt;/span&gt;,&amp;nbsp;&lt;span class=&quot;src_digit&quot;&gt;4&lt;/span&gt;));&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;printf(&lt;span class=&quot;src_doublequotation&quot;&gt;&amp;quot;substr_utf8($testStr,&amp;nbsp;13,&amp;nbsp;5)&amp;nbsp;=&amp;nbsp;%s\n&amp;quot;&lt;/span&gt;,&amp;nbsp;substr_utf8(strBuf,&amp;nbsp;testStr,&amp;nbsp;&lt;span class=&quot;src_digit&quot;&gt;13&lt;/span&gt;,&amp;nbsp;&lt;span class=&quot;src_digit&quot;&gt;5&lt;/span&gt;));&lt;br&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_keyword&quot;&gt;return&lt;/span&gt;&amp;nbsp;&lt;span class=&quot;src_digit&quot;&gt;0&lt;/span&gt;;&lt;br&gt;}&lt;br&gt;&lt;br&gt;&lt;span class=&quot;src_multilinecomment&quot;&gt;/*&amp;nbsp;UTF-8でエンコードされた文字列の部分文字列を取り出す&amp;nbsp;*/&lt;/span&gt;&lt;br&gt;&lt;span class=&quot;src_multilinecomment&quot;&gt;/*&amp;nbsp;substr_utf8&amp;nbsp;(文字列式,&amp;nbsp;オフセット,&amp;nbsp;長さ）*/&lt;/span&gt;&lt;br&gt;&lt;span class=&quot;src_typekeyword&quot;&gt;char&lt;/span&gt;&amp;nbsp;*substr_utf8(&lt;span class=&quot;src_typekeyword&quot;&gt;char&lt;/span&gt;&amp;nbsp;*dest,&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;char&lt;/span&gt;&amp;nbsp;*src,&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;int&lt;/span&gt;&amp;nbsp;offset,&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;int&lt;/span&gt;&amp;nbsp;len)&lt;br&gt;{&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;int&lt;/span&gt;&amp;nbsp;srclen&amp;nbsp;=&amp;nbsp;strlen(src);&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;int&lt;/span&gt;&amp;nbsp;pos&amp;nbsp;=&amp;nbsp;&lt;span class=&quot;src_digit&quot;&gt;0&lt;/span&gt;;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;int&lt;/span&gt;&amp;nbsp;count&amp;nbsp;=&amp;nbsp;&lt;span class=&quot;src_digit&quot;&gt;0&lt;/span&gt;;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;char&lt;/span&gt;&amp;nbsp;*cp&amp;nbsp;=&amp;nbsp;dest;&lt;br&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_keyword&quot;&gt;while&lt;/span&gt;&amp;nbsp;(pos&amp;nbsp;&amp;lt;&amp;nbsp;srclen)&amp;nbsp;{&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;unsigned&lt;/span&gt;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;char&lt;/span&gt;&amp;nbsp;code;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;code&amp;nbsp;=&amp;nbsp;*(src&amp;nbsp;+&amp;nbsp;pos);&amp;nbsp;&lt;span class=&quot;src_multilinecomment&quot;&gt;/*&amp;nbsp;ASCIIコード値を取得&amp;nbsp;*/&lt;/span&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;int&lt;/span&gt;&amp;nbsp;bytelen&amp;nbsp;=&amp;nbsp;_bytesize(code);&lt;br&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_keyword&quot;&gt;if&lt;/span&gt;&amp;nbsp;(count&amp;nbsp;&amp;gt;=&amp;nbsp;offset&amp;nbsp;&amp;amp;&amp;amp;&amp;nbsp;count&amp;nbsp;&amp;lt;&amp;nbsp;(offset&amp;nbsp;+&amp;nbsp;len))&amp;nbsp;{&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;memcpy(cp,&amp;nbsp;(src&amp;nbsp;+&amp;nbsp;pos),&amp;nbsp;bytelen);&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;cp&amp;nbsp;+=&amp;nbsp;bytelen;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;*cp&amp;nbsp;=&amp;nbsp;&lt;span class=&quot;src_singlequotation&quot;&gt;'\0'&lt;/span&gt;;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;}&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;pos&amp;nbsp;+=&amp;nbsp;bytelen;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;count++;&amp;nbsp;&lt;span class=&quot;src_multilinecomment&quot;&gt;/*&amp;nbsp;文字数をカウント&amp;nbsp;*/&lt;/span&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;}&lt;br&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_keyword&quot;&gt;return&lt;/span&gt;&amp;nbsp;dest;&lt;br&gt;}&lt;br&gt;&lt;br&gt;&lt;span class=&quot;src_multilinecomment&quot;&gt;/*&amp;nbsp;文字のバイト長を求める&amp;nbsp;*/&lt;/span&gt;&lt;br&gt;&lt;span class=&quot;src_typekeyword&quot;&gt;int&lt;/span&gt;&amp;nbsp;_bytesize(&lt;span class=&quot;src_typekeyword&quot;&gt;unsigned&lt;/span&gt;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;char&lt;/span&gt;&amp;nbsp;code)&lt;br&gt;{&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;int&lt;/span&gt;&amp;nbsp;size&amp;nbsp;=&amp;nbsp;&lt;span class=&quot;src_digit&quot;&gt;1&lt;/span&gt;;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;int&lt;/span&gt;&amp;nbsp;i;&lt;br&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_keyword&quot;&gt;if&lt;/span&gt;&amp;nbsp;(&lt;span class=&quot;src_digit&quot;&gt;0x80&lt;/span&gt;&amp;nbsp;&amp;amp;&amp;nbsp;code)&amp;nbsp;{&amp;nbsp;&lt;span class=&quot;src_multilinecomment&quot;&gt;/*&amp;nbsp;1バイト文字以外&amp;nbsp;*/&lt;/span&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_keyword&quot;&gt;for&lt;/span&gt;&amp;nbsp;(i&amp;nbsp;=&amp;nbsp;&lt;span class=&quot;src_digit&quot;&gt;2&lt;/span&gt;;&amp;nbsp;i&amp;nbsp;&amp;lt;=&amp;nbsp;&lt;span class=&quot;src_digit&quot;&gt;8&lt;/span&gt;;&amp;nbsp;i++)&amp;nbsp;{&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;code&amp;nbsp;&amp;lt;&amp;lt;=&amp;nbsp;&lt;span class=&quot;src_digit&quot;&gt;1&lt;/span&gt;;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_keyword&quot;&gt;if&lt;/span&gt;&amp;nbsp;(!(&lt;span class=&quot;src_digit&quot;&gt;0x80&lt;/span&gt;&amp;nbsp;&amp;amp;&amp;nbsp;code))&amp;nbsp;{&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_keyword&quot;&gt;break&lt;/span&gt;;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;}&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;size++;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;}&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;}&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_keyword&quot;&gt;return&lt;/span&gt;&amp;nbsp;size;&lt;br&gt;}&lt;br&gt;&lt;/p&gt;&lt;p&gt;&lt;strong&gt;実行結果&lt;/strong&gt;&lt;br&gt;$ ./substr_utf8&lt;br&gt;substr_utf8($testStr, 0, 5) = ABCDE&lt;br&gt;substr_utf8($testStr, 3, 3) = DEF&lt;br&gt;substr_utf8($testStr, 10, 4) = えおアイ&lt;br&gt;substr_utf8($testStr, 13, 5) = イウエオ愛&lt;br&gt;&lt;/p&gt;&lt;br /&gt;&lt;a href=&quot;https://59log.com/?func=detail&amp;amp;id=2324#link&quot; target=&quot;_blank&quot;&gt;Link(3)&lt;/a&gt; | &lt;a href=&quot;https://59log.com/?func=detail&amp;amp;id=2324#trackback&quot; target=&quot;_blank&quot;&gt;Trackback(0)&lt;/a&gt; | &lt;a href=&quot;https://59log.com/?func=detail&amp;amp;id=2324#comment&quot; target=&quot;_blank&quot;&gt;Comment(0)&lt;/a&gt;&lt;br /&gt;&lt;p&gt;&lt;h3&gt;キーワード&lt;/h3&gt;&lt;p&gt;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=C%E8%A8%80%E8%AA%9E&quot; title=&quot;C言語&quot;&gt;C言語&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=%E3%82%B5%E3%83%B3%E3%83%97%E3%83%AB&quot; title=&quot;サンプル&quot;&gt;サンプル&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%A0&quot; title=&quot;プログラム&quot;&gt;プログラム&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%9F%E3%83%B3%E3%82%B0&quot; title=&quot;プログラミング&quot;&gt;プログラミング&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=UTF8&quot; title=&quot;UTF8&quot;&gt;UTF8&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=substr&quot; title=&quot;substr&quot;&gt;substr&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=%E6%96%87%E5%AD%97%E5%88%97&quot; title=&quot;文字列&quot;&gt;文字列&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;/p&gt;&lt;/p&gt;&lt;p&gt;&lt;a href=&quot;https://59log.com/&quot;&gt;語句ログ - ニュース、プログラミング、システムトレードの用語解説 - 日本の注目ニュース、コンピュータープログラミング（C/C++,Perl,PHP,SQL）、システムトレード（FX,CFD,株価指数,先物）に関する語句（Word）を日本語や英語で解説&lt;/a&gt;&lt;/p&gt;</description>
    <link>https://59log.com/?func=detail&amp;id=2324</link>
    <pubDate>Tue, 02 Jul 2013 11:02:48 +0900</pubDate>
  </item>
  <item>
    <title>[C言語]UTF-8でエンコードされた文字列の文字数を取得するコード</title>
    <description>&lt;p&gt;C言語のstrlen関数では文字列の長さとして返ってくる値はバイト単位となるので、UTF-8でエンコードされている場合、漢字、ひらがな、カタカナなどは1文字で3となってしまいます。&lt;/p&gt;&lt;p&gt;Webアプリケーションのテキスト処理ではそれでは不都合な場合もことも多いので、半角英数も全角文字（漢字、ひらがな、カタカナなど） も1文字としてカウントする関数を作成することにします。 &lt;/p&gt;&lt;p&gt;&lt;span class=&quot;src_preprocessor&quot;&gt;#include&amp;nbsp;&amp;lt;stdio.h&amp;gt;&lt;/span&gt;&lt;br&gt;&lt;span class=&quot;src_preprocessor&quot;&gt;#include&amp;nbsp;&amp;lt;string.h&amp;gt;&lt;/span&gt;&lt;br&gt;&lt;br&gt;&lt;span class=&quot;src_typekeyword&quot;&gt;int&lt;/span&gt;&amp;nbsp;strlen_utf8(&lt;span class=&quot;src_typekeyword&quot;&gt;char&lt;/span&gt;&amp;nbsp;*cp);&lt;br&gt;&lt;span class=&quot;src_typekeyword&quot;&gt;int&lt;/span&gt;&amp;nbsp;_bytesize(&lt;span class=&quot;src_typekeyword&quot;&gt;unsigned&lt;/span&gt;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;char&lt;/span&gt;&amp;nbsp;code);&lt;br&gt;&lt;br&gt;&lt;span class=&quot;src_typekeyword&quot;&gt;int&lt;/span&gt;&amp;nbsp;main(&lt;span class=&quot;src_keyword&quot;&gt;void&lt;/span&gt;)&lt;br&gt;{&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;char&lt;/span&gt;&amp;nbsp;*testAscii&amp;nbsp;=&amp;nbsp;&lt;span class=&quot;src_doublequotation&quot;&gt;&amp;quot;ABCDEFG&amp;quot;&lt;/span&gt;;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;char&lt;/span&gt;&amp;nbsp;*testHira&amp;nbsp;&amp;nbsp;=&amp;nbsp;&lt;span class=&quot;src_doublequotation&quot;&gt;&amp;quot;あいうえお&amp;quot;&lt;/span&gt;;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;char&lt;/span&gt;&amp;nbsp;*testKata&amp;nbsp;&amp;nbsp;=&amp;nbsp;&lt;span class=&quot;src_doublequotation&quot;&gt;&amp;quot;アイウエ&amp;quot;&lt;/span&gt;;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;char&lt;/span&gt;&amp;nbsp;*testKanji&amp;nbsp;=&amp;nbsp;&lt;span class=&quot;src_doublequotation&quot;&gt;&amp;quot;愛々木&amp;quot;&lt;/span&gt;;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;char&lt;/span&gt;&amp;nbsp;*testAll&amp;nbsp;=&amp;nbsp;&lt;span class=&quot;src_doublequotation&quot;&gt;&amp;quot;ABCDEFGあいうえおアイウエオ愛夢佐々木&amp;quot;&lt;/span&gt;;&lt;br&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;printf(&lt;span class=&quot;src_doublequotation&quot;&gt;&amp;quot;strlen(testAscii)&amp;nbsp;=&amp;nbsp;%d\n&amp;quot;&lt;/span&gt;,&amp;nbsp;strlen(testAscii));&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;printf(&lt;span class=&quot;src_doublequotation&quot;&gt;&amp;quot;strlen_utf8(testAscii)&amp;nbsp;=&amp;nbsp;%d\n&amp;quot;&lt;/span&gt;,&amp;nbsp;strlen_utf8(testAscii));&lt;br&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;printf(&lt;span class=&quot;src_doublequotation&quot;&gt;&amp;quot;strlen(testHira)&amp;nbsp;=&amp;nbsp;%d\n&amp;quot;&lt;/span&gt;,&amp;nbsp;strlen(testHira));&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;printf(&lt;span class=&quot;src_doublequotation&quot;&gt;&amp;quot;strlen_utf8(testHira)&amp;nbsp;=&amp;nbsp;%d\n&amp;quot;&lt;/span&gt;,&amp;nbsp;strlen_utf8(testHira));&lt;br&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;printf(&lt;span class=&quot;src_doublequotation&quot;&gt;&amp;quot;strlen(testKata)&amp;nbsp;=&amp;nbsp;%d\n&amp;quot;&lt;/span&gt;,&amp;nbsp;strlen(testKata));&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;printf(&lt;span class=&quot;src_doublequotation&quot;&gt;&amp;quot;strlen_utf8(testKata)&amp;nbsp;=&amp;nbsp;%d\n&amp;quot;&lt;/span&gt;,&amp;nbsp;strlen_utf8(testKata));&lt;br&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;printf(&lt;span class=&quot;src_doublequotation&quot;&gt;&amp;quot;strlen(testKanji)&amp;nbsp;=&amp;nbsp;%d\n&amp;quot;&lt;/span&gt;,&amp;nbsp;strlen(testKanji));&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;printf(&lt;span class=&quot;src_doublequotation&quot;&gt;&amp;quot;strlen_utf8(testKanji)&amp;nbsp;=&amp;nbsp;%d\n&amp;quot;&lt;/span&gt;,&amp;nbsp;strlen_utf8(testKanji));&lt;br&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;printf(&lt;span class=&quot;src_doublequotation&quot;&gt;&amp;quot;strlen(testAll)&amp;nbsp;=&amp;nbsp;%d\n&amp;quot;&lt;/span&gt;,&amp;nbsp;strlen(testAll));&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;printf(&lt;span class=&quot;src_doublequotation&quot;&gt;&amp;quot;strlen_utf8(testAll)&amp;nbsp;=&amp;nbsp;%d\n&amp;quot;&lt;/span&gt;,&amp;nbsp;strlen_utf8(testAll));&lt;br&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_keyword&quot;&gt;return&lt;/span&gt;&amp;nbsp;&lt;span class=&quot;src_digit&quot;&gt;0&lt;/span&gt;;&lt;br&gt;}&lt;br&gt;&lt;br&gt;&lt;span class=&quot;src_multilinecomment&quot;&gt;/*&amp;nbsp;UTF-8でエンコードされた文字列の文字数を取得&amp;nbsp;*/&lt;/span&gt;&lt;br&gt;&lt;span class=&quot;src_typekeyword&quot;&gt;int&lt;/span&gt;&amp;nbsp;strlen_utf8(&lt;span class=&quot;src_typekeyword&quot;&gt;char&lt;/span&gt;&amp;nbsp;*cp)&lt;br&gt;{&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;int&lt;/span&gt;&amp;nbsp;textlen&amp;nbsp;=&amp;nbsp;strlen(cp);&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;int&lt;/span&gt;&amp;nbsp;pos&amp;nbsp;=&amp;nbsp;&lt;span class=&quot;src_digit&quot;&gt;0&lt;/span&gt;;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;int&lt;/span&gt;&amp;nbsp;count&amp;nbsp;=&amp;nbsp;&lt;span class=&quot;src_digit&quot;&gt;0&lt;/span&gt;;&lt;br&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_keyword&quot;&gt;while&lt;/span&gt;&amp;nbsp;(pos&amp;nbsp;&amp;lt;&amp;nbsp;textlen)&amp;nbsp;{&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;unsigned&lt;/span&gt;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;char&lt;/span&gt;&amp;nbsp;code;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;code&amp;nbsp;=&amp;nbsp;*(cp&amp;nbsp;+&amp;nbsp;pos);&amp;nbsp;&lt;span class=&quot;src_multilinecomment&quot;&gt;/*&amp;nbsp;ASCIIコード値を取得&amp;nbsp;*/&lt;/span&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;int&lt;/span&gt;&amp;nbsp;bytelen&amp;nbsp;=&amp;nbsp;_bytesize(code);&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;pos&amp;nbsp;+=&amp;nbsp;bytelen;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;count++;&amp;nbsp;&lt;span class=&quot;src_multilinecomment&quot;&gt;/*&amp;nbsp;文字数をカウント&amp;nbsp;*/&lt;/span&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;}&lt;br&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_keyword&quot;&gt;return&lt;/span&gt;&amp;nbsp;count;&lt;br&gt;}&lt;br&gt;&lt;br&gt;&lt;span class=&quot;src_multilinecomment&quot;&gt;/*&amp;nbsp;文字のバイト長を求める&amp;nbsp;*/&lt;/span&gt;&lt;br&gt;&lt;span class=&quot;src_typekeyword&quot;&gt;int&lt;/span&gt;&amp;nbsp;_bytesize(&lt;span class=&quot;src_typekeyword&quot;&gt;unsigned&lt;/span&gt;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;char&lt;/span&gt;&amp;nbsp;code)&lt;br&gt;{&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;int&lt;/span&gt;&amp;nbsp;size&amp;nbsp;=&amp;nbsp;&lt;span class=&quot;src_digit&quot;&gt;1&lt;/span&gt;;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_typekeyword&quot;&gt;int&lt;/span&gt;&amp;nbsp;i;&lt;br&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_keyword&quot;&gt;if&lt;/span&gt;&amp;nbsp;(&lt;span class=&quot;src_digit&quot;&gt;0x80&lt;/span&gt;&amp;nbsp;&amp;amp;&amp;nbsp;code)&amp;nbsp;{&amp;nbsp;&lt;span class=&quot;src_multilinecomment&quot;&gt;/*&amp;nbsp;1バイト文字以外&amp;nbsp;*/&lt;/span&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_keyword&quot;&gt;for&lt;/span&gt;&amp;nbsp;(i&amp;nbsp;=&amp;nbsp;&lt;span class=&quot;src_digit&quot;&gt;2&lt;/span&gt;;&amp;nbsp;i&amp;nbsp;&amp;lt;=&amp;nbsp;&lt;span class=&quot;src_digit&quot;&gt;8&lt;/span&gt;;&amp;nbsp;i++)&amp;nbsp;{&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;code&amp;nbsp;&amp;lt;&amp;lt;=&amp;nbsp;&lt;span class=&quot;src_digit&quot;&gt;1&lt;/span&gt;;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_keyword&quot;&gt;if&lt;/span&gt;&amp;nbsp;(!(&lt;span class=&quot;src_digit&quot;&gt;0x80&lt;/span&gt;&amp;nbsp;&amp;amp;&amp;nbsp;code))&amp;nbsp;{&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_keyword&quot;&gt;break&lt;/span&gt;;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;}&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;size++;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;}&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;}&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&lt;span class=&quot;src_keyword&quot;&gt;return&lt;/span&gt;&amp;nbsp;size;&lt;br&gt;}&lt;br&gt;&lt;/p&gt;&lt;p&gt;strlen_utf8関数では、1バイト目のASCIIコード値をパラメータとして_bytesize関数を呼び出して文字のバイト数を求め、1文字分の処理を行うたびに文字数をカウントアップしています。&lt;/p&gt;&lt;p&gt;また、_bytesize関数ではパラメータで渡されたコード値の場合の文字のバイト数を、コード値のビットの状態から判定して戻り値として返しています。 &lt;/p&gt;&lt;p&gt;プロクラムの実行結果は以下のようになります。&lt;br&gt;&lt;br&gt;kagahiro@kagahiro-PC ~/sample/c&lt;br&gt;$ ./strlen_utf8&lt;br&gt;strlen(testAscii) = 7&lt;br&gt;strlen_utf8(testAscii) = 7&lt;br&gt;strlen(testHira) = 15&lt;br&gt;strlen_utf8(testHira) = 5&lt;br&gt;strlen(testKata) = 12&lt;br&gt;strlen_utf8(testKata) = 4&lt;br&gt;strlen(testKanji) = 9&lt;br&gt;strlen_utf8(testKanji) = 3&lt;br&gt;strlen(testAll) = 52&lt;br&gt;strlen_utf8(testAll) = 22&lt;br&gt;&lt;/p&gt;&lt;br /&gt;&lt;a href=&quot;https://59log.com/?func=detail&amp;amp;id=2323#link&quot; target=&quot;_blank&quot;&gt;Link(3)&lt;/a&gt; | &lt;a href=&quot;https://59log.com/?func=detail&amp;amp;id=2323#trackback&quot; target=&quot;_blank&quot;&gt;Trackback(0)&lt;/a&gt; | &lt;a href=&quot;https://59log.com/?func=detail&amp;amp;id=2323#comment&quot; target=&quot;_blank&quot;&gt;Comment(1)&lt;/a&gt;&lt;br /&gt;&lt;p&gt;&lt;h3&gt;キーワード&lt;/h3&gt;&lt;p&gt;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=C%E8%A8%80%E8%AA%9E&quot; title=&quot;C言語&quot;&gt;C言語&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=%E3%82%B5%E3%83%B3%E3%83%97%E3%83%AB&quot; title=&quot;サンプル&quot;&gt;サンプル&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%A0&quot; title=&quot;プログラム&quot;&gt;プログラム&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%9F%E3%83%B3%E3%82%B0&quot; title=&quot;プログラミング&quot;&gt;プログラミング&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=UTF8&quot; title=&quot;UTF8&quot;&gt;UTF8&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=%E6%96%87%E5%AD%97%E5%88%97&quot; title=&quot;文字列&quot;&gt;文字列&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=%E6%96%87%E5%AD%97%E6%95%B0&quot; title=&quot;文字数&quot;&gt;文字数&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;/p&gt;&lt;/p&gt;&lt;p&gt;&lt;a href=&quot;https://59log.com/&quot;&gt;語句ログ - ニュース、プログラミング、システムトレードの用語解説 - 日本の注目ニュース、コンピュータープログラミング（C/C++,Perl,PHP,SQL）、システムトレード（FX,CFD,株価指数,先物）に関する語句（Word）を日本語や英語で解説&lt;/a&gt;&lt;/p&gt;</description>
    <link>https://59log.com/?func=detail&amp;id=2323</link>
    <pubDate>Mon, 01 Jul 2013 20:46:54 +0900</pubDate>
  </item>
  <item>
    <title>[Perl]UTF-8でエンコードされた文字列の部分文字列を取り出すコード</title>
    <description>&lt;p&gt;Perlのsubstr関数ではバイト単位の操作になるので、漢字、ひらがな、カタカナなどの全角文字を文字数で指定して部分文字列を取り出すことができません。それでは不都合なことも多いので、半角英数も全角文字も1文字として部分文字列を取り出すことができる関数を作成します。&lt;/p&gt;&lt;p&gt;以下はそのコードです。&lt;a href=&quot;http://59log.com/detail2243.html&quot; target=&quot;_blank&quot;&gt;[Perl]UTF-8でエンコードされた文字列の文字数を取得するコード&lt;/a&gt;と同様に、文字の1バイト目のビットの状態を調べることによってその文字が何バイト文字を判定しています。&lt;/p&gt;&lt;p&gt;#!/usr/bin/perl&lt;br&gt;&lt;br&gt;use&amp;nbsp;strict;&lt;br&gt;use&amp;nbsp;warnings;&lt;br&gt;&lt;br&gt;my&amp;nbsp;$testStr&amp;nbsp;=&amp;nbsp;&amp;quot;ABCDEFGあいうえおアイウエオ愛夢佐々木&amp;quot;;&lt;br&gt;&lt;br&gt;print&amp;nbsp;&amp;quot;substr_utf8($testStr,&amp;nbsp;0,&amp;nbsp;5)&amp;nbsp;=&amp;nbsp;&amp;quot;&amp;nbsp;.&amp;nbsp;substr_utf8($testStr,&amp;nbsp;0,&amp;nbsp;5),&amp;nbsp;&amp;quot;\n&amp;quot;;&lt;br&gt;print&amp;nbsp;&amp;quot;substr_utf8($testStr,&amp;nbsp;3,&amp;nbsp;3)&amp;nbsp;=&amp;nbsp;&amp;quot;&amp;nbsp;.&amp;nbsp;substr_utf8($testStr,&amp;nbsp;3,&amp;nbsp;3),&amp;nbsp;&amp;quot;\n&amp;quot;;&lt;br&gt;print&amp;nbsp;&amp;quot;substr_utf8($testStr,&amp;nbsp;10,&amp;nbsp;4)&amp;nbsp;=&amp;nbsp;&amp;quot;&amp;nbsp;.&amp;nbsp;substr_utf8($testStr,&amp;nbsp;10,&amp;nbsp;4),&amp;nbsp;&amp;quot;\n&amp;quot;;&lt;br&gt;print&amp;nbsp;&amp;quot;substr_utf8($testStr,&amp;nbsp;13,&amp;nbsp;5)&amp;nbsp;=&amp;nbsp;&amp;quot;&amp;nbsp;.&amp;nbsp;substr_utf8($testStr,&amp;nbsp;13,&amp;nbsp;5),&amp;nbsp;&amp;quot;\n&amp;quot;;&lt;br&gt;print&amp;nbsp;&amp;quot;substr_utf8($testStr,&amp;nbsp;13)&amp;nbsp;=&amp;nbsp;&amp;quot;&amp;nbsp;.&amp;nbsp;substr_utf8($testStr,&amp;nbsp;13),&amp;nbsp;&amp;quot;\n&amp;quot;;&lt;br&gt;&lt;br&gt;exit;&lt;br&gt;&lt;br&gt;#&amp;nbsp;UTF-8でエンコードされた文字列の部分文字列を取り出す&lt;br&gt;#&amp;nbsp;substr_utf8&amp;nbsp;(文字列式,&amp;nbsp;オフセット[,&amp;nbsp;長さ]）長さを指定しなかった場合は最後まで&lt;br&gt;sub&amp;nbsp;substr_utf8&amp;nbsp;{&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;my&amp;nbsp;($src,&amp;nbsp;$offset,&amp;nbsp;$len)&amp;nbsp;=&amp;nbsp;@_;&lt;br&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;my&amp;nbsp;$srclen&amp;nbsp;=&amp;nbsp;length($src);&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;my&amp;nbsp;$pos&amp;nbsp;=&amp;nbsp;0;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;my&amp;nbsp;$count&amp;nbsp;=&amp;nbsp;0;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;my&amp;nbsp;$dest&amp;nbsp;=&amp;nbsp;'';&lt;br&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;while&amp;nbsp;($pos&amp;nbsp;&amp;lt;&amp;nbsp;$srclen)&amp;nbsp;{&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;my&amp;nbsp;$code&amp;nbsp;=&amp;nbsp;ord&amp;nbsp;substr($src,&amp;nbsp;$pos,&amp;nbsp;1);&amp;nbsp;#&amp;nbsp;先頭のASCIIコード値を取得&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;my&amp;nbsp;$bytelen&amp;nbsp;=&amp;nbsp;_bytesize($code);&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;if&amp;nbsp;(defined($len)){&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;if&amp;nbsp;($count&amp;nbsp;&amp;gt;=&amp;nbsp;$offset&amp;nbsp;&amp;amp;&amp;amp;&amp;nbsp;$count&amp;nbsp;&amp;lt;&amp;nbsp;($offset&amp;nbsp;+&amp;nbsp;$len))&amp;nbsp;{&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;$dest&amp;nbsp;.=&amp;nbsp;substr($src,&amp;nbsp;$pos,&amp;nbsp;$bytelen);&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;}&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;}&amp;nbsp;else&amp;nbsp;{&amp;nbsp;#&amp;nbsp;長さ指定なし&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;if&amp;nbsp;($count&amp;nbsp;&amp;gt;=&amp;nbsp;$offset)&amp;nbsp;{&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;$dest&amp;nbsp;.=&amp;nbsp;substr($src,&amp;nbsp;$pos,&amp;nbsp;$bytelen);&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;}&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;}&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;$pos&amp;nbsp;+=&amp;nbsp;$bytelen;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;$count++;&amp;nbsp;#&amp;nbsp;文字数をカウント&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;}&lt;br&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;return&amp;nbsp;$dest;&lt;br&gt;}&lt;br&gt;&lt;br&gt;#&amp;nbsp;文字のバイト長を求める&lt;br&gt;sub&amp;nbsp;_bytesize&amp;nbsp;{&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;my&amp;nbsp;$code&amp;nbsp;=&amp;nbsp;shift;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;my&amp;nbsp;$size&amp;nbsp;=&amp;nbsp;1;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;if&amp;nbsp;(0x80&amp;nbsp;&amp;amp;&amp;nbsp;$code)&amp;nbsp;{&amp;nbsp;#&amp;nbsp;1バイト文字以外&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;$code&amp;nbsp;&amp;lt;&amp;lt;=&amp;nbsp;1;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;for&amp;nbsp;my&amp;nbsp;$i&amp;nbsp;(2&amp;nbsp;..&amp;nbsp;8)&amp;nbsp;{&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;$size++;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;$code&amp;nbsp;&amp;lt;&amp;lt;=&amp;nbsp;1;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;last&amp;nbsp;if&amp;nbsp;(!(0x80&amp;nbsp;&amp;amp;&amp;nbsp;$code));&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;}&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;}&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;return&amp;nbsp;$size;&lt;br&gt;}&lt;br&gt;&lt;/p&gt;&lt;p&gt;substr_utf8関数では、substr関数を使用して1バイト目のASCIIコード値を取得し、_bytesize関数を呼び出して文字のバイト数を求め、その文字がパラメータで指定された範囲の場合は、戻り値として返す文字列に連結し、そうでなかった場合は文字数のカウントアップのみ行なっています。&lt;/p&gt;&lt;p&gt;_bytesize関数ではパラメータで渡されたコード値の場合の文字のバイト数を、コード値のビットの状態から判定し戻り値として返しています。&lt;/p&gt;&lt;p&gt;&lt;a href=&quot;http://www.amazon.co.jp/exec/obidos/ASIN/4774150258/aaaaaaee-22/ref=nosim&quot;&gt;もっと自在にサーバを使い倒す 業務に役立つPerl (Software Design ｐlus)&lt;/a&gt;&lt;br /&gt;&lt;small&gt;技術評論社  著者：木本 裕紀  &lt;font color=&quot;#66ccff&quot;&gt;&lt;/font&gt;&lt;/small&gt;&lt;/p&gt;&lt;p&gt;&lt;a href=&quot;http://www.amazon.co.jp/exec/obidos/ASIN/4774150258/aaaaaaee-22/ref=nosim&quot;&gt;&lt;img src=&quot;http://ecx.images-amazon.com/images/I/51d4T7m8NzL.jpg&quot; border=&quot;0&quot; &gt;&lt;/a&gt;  &lt;br clear=&quot;left&quot; /&gt;&lt;/p&gt;&lt;p&gt;&lt;a href=&quot;http://www.amazon.co.jp/exec/obidos/ASIN/4774150258/aaaaaaee-22/ref=nosim&quot; target=&quot;_blank&quot;&gt;amazon.co.jpのカスタマーレビューを見る&lt;/a&gt;&lt;br /&gt;powered by &lt;a href=&quot;http://59bbs.org/amalink/&quot;&gt;amalink&lt;/a&gt;&lt;/p&gt;&lt;br /&gt;&lt;a href=&quot;https://59log.com/?func=detail&amp;amp;id=2244#link&quot; target=&quot;_blank&quot;&gt;Link(4)&lt;/a&gt; | &lt;a href=&quot;https://59log.com/?func=detail&amp;amp;id=2244#trackback&quot; target=&quot;_blank&quot;&gt;Trackback(0)&lt;/a&gt; | &lt;a href=&quot;https://59log.com/?func=detail&amp;amp;id=2244#comment&quot; target=&quot;_blank&quot;&gt;Comment(0)&lt;/a&gt;&lt;br /&gt;&lt;p&gt;&lt;h3&gt;キーワード&lt;/h3&gt;&lt;p&gt;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=Perl&quot; title=&quot;Perl&quot;&gt;Perl&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=%E9%83%A8%E5%88%86%E6%96%87%E5%AD%97%E5%88%97&quot; title=&quot;部分文字列&quot;&gt;部分文字列&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=%E3%82%B5%E3%83%B3%E3%83%97%E3%83%AB&quot; title=&quot;サンプル&quot;&gt;サンプル&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%A0&quot; title=&quot;プログラム&quot;&gt;プログラム&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=%E3%82%B3%E3%83%BC%E3%83%89&quot; title=&quot;コード&quot;&gt;コード&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;/p&gt;&lt;/p&gt;&lt;p&gt;&lt;a href=&quot;https://59log.com/&quot;&gt;語句ログ - ニュース、プログラミング、システムトレードの用語解説 - 日本の注目ニュース、コンピュータープログラミング（C/C++,Perl,PHP,SQL）、システムトレード（FX,CFD,株価指数,先物）に関する語句（Word）を日本語や英語で解説&lt;/a&gt;&lt;/p&gt;</description>
    <link>https://59log.com/?func=detail&amp;id=2244</link>
    <pubDate>Thu, 13 Dec 2012 10:51:25 +0900</pubDate>
  </item>
  <item>
    <title>[Perl]UTF-8でエンコードされた文字列の文字数を取得するコード</title>
    <description>&lt;p&gt;Perlのlength関数ではバイト単位となるので、UTF-8でエンコードされている場合、漢字、ひらがな、カタカナなどは1文字で3となってしまいます。&lt;/p&gt;&lt;p&gt;ブログなどのアプリケーションのテキスト処理ではそれでは不都合な場合もことも多いので、半角英数も全角文字（漢字、ひらがな、カタカナなど）も1文字としてカウントする関数を作成することにします。&lt;/p&gt;&lt;p&gt;UTF-8では、&lt;br&gt;&lt;br&gt;1バイト目の先頭ビットが0の場合は1バイト文字&lt;br&gt;1バイト目の先頭から3ビットが110の場合は2バイト文字&lt;br&gt;1バイト目の先頭から4ビットが1110の場合は3バイト文字&lt;br&gt;1バイト目の先頭から5ビットが11110の場合は4バイト文字&lt;br&gt;1バイト目の先頭から6ビットが111110の場合は5バイト文字&lt;br&gt;1バイト目の先頭から7ビットが1111110の場合は2バイト文字&lt;br&gt;&lt;br&gt;という仕様ですので、1バイト目のビットの状態を調べることによって、その文字が何バイトかを調べることができます。&lt;br&gt;&lt;/p&gt;&lt;p&gt;以下のコードでは、この仕様にもとづいて全角文字を含む文字列の文字数を取得しています。&lt;/p&gt;&lt;p&gt;#!/usr/bin/perl&lt;br&gt;&lt;br&gt;use&amp;nbsp;strict;&lt;br&gt;use&amp;nbsp;warnings;&lt;br&gt;&lt;br&gt;my&amp;nbsp;$testAscii&amp;nbsp;=&amp;nbsp;&amp;quot;ABCDEFG&amp;quot;;&lt;br&gt;my&amp;nbsp;$testHira&amp;nbsp;&amp;nbsp;=&amp;nbsp;&amp;quot;あいうえお&amp;quot;;&lt;br&gt;my&amp;nbsp;$testKata&amp;nbsp;&amp;nbsp;=&amp;nbsp;&amp;quot;アイウエ&amp;quot;;&lt;br&gt;my&amp;nbsp;$testKanji&amp;nbsp;=&amp;nbsp;&amp;quot;愛々木&amp;quot;;&lt;br&gt;my&amp;nbsp;$testAll&amp;nbsp;=&amp;nbsp;&amp;quot;ABCDEFGあいうえおアイウエオ愛夢佐々木&amp;quot;;&lt;br&gt;&lt;br&gt;print&amp;nbsp;&amp;quot;length($testAscii)&amp;nbsp;=&amp;nbsp;&amp;quot;.length($testAscii),&amp;nbsp;&amp;quot;\n&amp;quot;;&lt;br&gt;print&amp;nbsp;&amp;quot;strlen_utf8($testAscii)&amp;nbsp;=&amp;nbsp;&amp;quot;.strlen_utf8($testAscii),&amp;nbsp;&amp;quot;\n&amp;quot;;&lt;br&gt;&lt;br&gt;print&amp;nbsp;&amp;quot;length($testHira)&amp;nbsp;=&amp;nbsp;&amp;quot;.length($testHira),&amp;nbsp;&amp;quot;\n&amp;quot;;&lt;br&gt;print&amp;nbsp;&amp;quot;strlen_utf8($testHira)&amp;nbsp;=&amp;nbsp;&amp;quot;.strlen_utf8($testHira),&amp;nbsp;&amp;quot;\n&amp;quot;;&lt;br&gt;&lt;br&gt;print&amp;nbsp;&amp;quot;length($testKata)&amp;nbsp;=&amp;nbsp;&amp;quot;.length($testKata),&amp;nbsp;&amp;quot;\n&amp;quot;;&lt;br&gt;print&amp;nbsp;&amp;quot;strlen_utf8($testKata)&amp;nbsp;=&amp;nbsp;&amp;quot;.strlen_utf8($testKata),&amp;nbsp;&amp;quot;\n&amp;quot;;&lt;br&gt;&lt;br&gt;print&amp;nbsp;&amp;quot;length($testKanji)&amp;nbsp;=&amp;nbsp;&amp;quot;.length($testKanji),&amp;nbsp;&amp;quot;\n&amp;quot;;&lt;br&gt;print&amp;nbsp;&amp;quot;strlen_utf8($testKanji)&amp;nbsp;=&amp;nbsp;&amp;quot;.strlen_utf8($testKanji),&amp;nbsp;&amp;quot;\n&amp;quot;;&lt;br&gt;&lt;br&gt;print&amp;nbsp;&amp;quot;length($testAll)&amp;nbsp;=&amp;nbsp;&amp;quot;.length($testAll),&amp;nbsp;&amp;quot;\n&amp;quot;;&lt;br&gt;print&amp;nbsp;&amp;quot;strlen_utf8($testAll)&amp;nbsp;=&amp;nbsp;&amp;quot;.strlen_utf8($testAll),&amp;nbsp;&amp;quot;\n&amp;quot;;&lt;br&gt;&lt;br&gt;exit;&lt;br&gt;&lt;br&gt;#&amp;nbsp;UTF-8でエンコードされた文字列の文字数を取得する。&lt;br&gt;sub&amp;nbsp;strlen_utf8&amp;nbsp;{&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;my&amp;nbsp;($text)&amp;nbsp;=&amp;nbsp;@_;&lt;br&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;my&amp;nbsp;$textlen&amp;nbsp;=&amp;nbsp;length($text);&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;my&amp;nbsp;$pos&amp;nbsp;=&amp;nbsp;0;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;my&amp;nbsp;$count&amp;nbsp;=&amp;nbsp;0;&lt;br&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;while&amp;nbsp;($pos&amp;nbsp;&amp;lt;&amp;nbsp;$textlen)&amp;nbsp;{&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;my&amp;nbsp;$code&amp;nbsp;=&amp;nbsp;ord&amp;nbsp;substr($text,&amp;nbsp;$pos,&amp;nbsp;1);&amp;nbsp;#&amp;nbsp;先頭のASCIIコード値を取得&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;my&amp;nbsp;$bytelen&amp;nbsp;=&amp;nbsp;_bytesize($code);&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;$pos&amp;nbsp;+=&amp;nbsp;$bytelen;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;$count++;&amp;nbsp;#&amp;nbsp;文字数をカウント&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;}&lt;br&gt;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;return&amp;nbsp;$count;&lt;br&gt;}&lt;br&gt;&lt;br&gt;#&amp;nbsp;文字のバイト長を求める&lt;br&gt;sub&amp;nbsp;_bytesize&amp;nbsp;{&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;my&amp;nbsp;($code)&amp;nbsp;=&amp;nbsp;@_;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;my&amp;nbsp;$size&amp;nbsp;=&amp;nbsp;1;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;if&amp;nbsp;(0x80&amp;nbsp;&amp;amp;&amp;nbsp;$code)&amp;nbsp;{&amp;nbsp;#&amp;nbsp;1バイト文字以外&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;$size++;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;$code&amp;nbsp;&amp;lt;&amp;lt;=&amp;nbsp;1;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;for&amp;nbsp;my&amp;nbsp;$i&amp;nbsp;(2&amp;nbsp;..&amp;nbsp;8)&amp;nbsp;{&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;last&amp;nbsp;if&amp;nbsp;(!(0x80&amp;nbsp;&amp;amp;&amp;nbsp;$code));&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;$size++;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;$code&amp;nbsp;&amp;lt;&amp;lt;=&amp;nbsp;1;&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;}&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;}&lt;br&gt;&amp;nbsp;&amp;nbsp;&amp;nbsp;&amp;nbsp;return&amp;nbsp;$size;&lt;br&gt;}&lt;br&gt;&lt;/p&gt;&lt;p&gt;strlen_utf8関数では、substr関数を使用して1バイト目のASCIIコード値を取得し、_bytesize関数を呼び出して文字のバイト数を求め、1文字分の処理を行うたびに文字数をカウントアップしています。&lt;/p&gt;&lt;p&gt;_bytesize関数ではパラメータで渡されたコード値の場合の文字のバイト数を、コード値のビットの状態から判定し戻り値として返しています。&lt;/p&gt;&lt;p&gt;&lt;a href=&quot;http://www.amazon.co.jp/exec/obidos/ASIN/4774145386/aaaaaaee-22/ref=nosim&quot;&gt;ゼロからわかる Perl言語超入門&lt;/a&gt;&lt;br /&gt;&lt;small&gt;技術評論社  著者：高橋 順子  &lt;font color=&quot;#66ccff&quot;&gt;&lt;/font&gt;&lt;/small&gt;&lt;/p&gt;&lt;p&gt;&lt;a href=&quot;http://www.amazon.co.jp/exec/obidos/ASIN/4774145386/aaaaaaee-22/ref=nosim&quot;&gt;&lt;img src=&quot;http://ecx.images-amazon.com/images/I/41cLYQHtnZL.jpg&quot; border=&quot;0&quot; &gt;&lt;/a&gt;  &lt;br clear=&quot;left&quot; /&gt;&lt;/p&gt;&lt;p&gt;&lt;a href=&quot;http://www.amazon.co.jp/exec/obidos/ASIN/4774145386/aaaaaaee-22/ref=nosim&quot; target=&quot;_blank&quot;&gt;amazon.co.jpのカスタマーレビューを見る&lt;/a&gt;&lt;br /&gt;powered by &lt;a href=&quot;http://59bbs.org/amalink/&quot;&gt;amalink&lt;/a&gt;&lt;/p&gt;&lt;br /&gt;&lt;a href=&quot;https://59log.com/?func=detail&amp;amp;id=2243#link&quot; target=&quot;_blank&quot;&gt;Link(3)&lt;/a&gt; | &lt;a href=&quot;https://59log.com/?func=detail&amp;amp;id=2243#trackback&quot; target=&quot;_blank&quot;&gt;Trackback(0)&lt;/a&gt; | &lt;a href=&quot;https://59log.com/?func=detail&amp;amp;id=2243#comment&quot; target=&quot;_blank&quot;&gt;Comment(1)&lt;/a&gt;&lt;br /&gt;&lt;p&gt;&lt;h3&gt;キーワード&lt;/h3&gt;&lt;p&gt;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=Perl&quot; title=&quot;Perl&quot;&gt;Perl&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=%E6%96%87%E5%AD%97%E6%95%B0&quot; title=&quot;文字数&quot;&gt;文字数&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=%E3%82%B5%E3%83%B3%E3%83%97%E3%83%AB&quot; title=&quot;サンプル&quot;&gt;サンプル&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%A0&quot; title=&quot;プログラム&quot;&gt;プログラム&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;em&gt;&lt;a href=&quot;https://59log.com/?q=%E3%82%B3%E3%83%BC%E3%83%89&quot; title=&quot;コード&quot;&gt;コード&lt;/a&gt;&lt;/em&gt;&amp;nbsp;&lt;/p&gt;&lt;/p&gt;&lt;p&gt;&lt;a href=&quot;https://59log.com/&quot;&gt;語句ログ - ニュース、プログラミング、システムトレードの用語解説 - 日本の注目ニュース、コンピュータープログラミング（C/C++,Perl,PHP,SQL）、システムトレード（FX,CFD,株価指数,先物）に関する語句（Word）を日本語や英語で解説&lt;/a&gt;&lt;/p&gt;</description>
    <link>https://59log.com/?func=detail&amp;id=2243</link>
    <pubDate>Wed, 12 Dec 2012 11:56:21 +0900</pubDate>
  </item>
  <item>
    <title>W-ZERO [es]、デュアル・キーボード搭載のモバイル端末</title>
    <description>&lt;strong&gt;W-ZERO [es]、ケータイの手軽さとパソコンの便利さが融合されたウィルコムのシャープ製モバイル端末&lt;/strong&gt;&lt;br /&gt;&lt;br /&gt;W-ZERO [es] は、2006年7月27日に販売が開始された、OSとして「Windows Mobile 5.0 日本語版」を採用し、デュアル・キーボードと2.8型VGA(640×480ドット)高精細モバイルASV液晶が搭載されたウィルコムのモバイル端末で、これまでのW-ZERO3製品が大型液晶、高機能の、よりパソコンに近い操作性を追求した商品群であるのに対し、W-ZERO3 [es] はスマートな操作性、高いモビリティーを追求した、より携帯電話に近い性能を求める顧客向けの商品となっている。&lt;br /&gt;&lt;br /&gt;ケータイの様に片手でスマートに入力できるダイヤルキーと、パソコンの様に両手でしっかり入力できるスライド式QWERTYキーのデュアル・キーボードを採用し、2.8型VGA高精細モバイルASV液晶で、ホームページやメールはもとより、ExcelRやWord、PowerPointRなどのパソコン用データなどもきめ細かく表示できる。また、少ない文字入力で漢字変換ができる、予測変換機能付き「ATOK」により、片手でのキー入力操作の利便性を高め、QWERTYキーでの両手入力と併せて入力のしやすさが追求されている。さらにこれらの機能の他にも、パソコン周辺機器による拡張性を実現するUSBホスト機能など、モバイルでの利用に便利な機能が数多く搭載されている。&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;http://click.linksynergy.com/fs-bin/click?id=A4uMZ3sbXTY&amp;offerid=100775.10000070&amp;type=2&amp;subid=0&quot; &gt;&lt;IMG border=0 src=&quot;https://store.willcom-inc.com/share/ec/common/images/dynamic/linkshare/ws007shp_185x185.jpg&quot; &gt;&lt;/a&gt;&lt;IMG border=0 width=1 height=1 src=&quot;http://ad.linksynergy.com/fs-bin/show?id=A4uMZ3sbXTY&amp;bids=100775.10000070&amp;type=2&amp;subid=0&quot; &gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;http://www.willcom-inc.com/ja/corporate/press/2006/07/04/index.html&quot; target=&quot;_blank&quot;&gt;デュアル・キーボードと業界初2.8型VGA高精細モバイルASV液晶※1を搭載洗練された大人のカタチとクオリティを実現した究極のモバイル W-ZERO3［es］ &lt;WS007SH&gt; を開発・発売&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;https://59log.com/?func=detail&amp;amp;id=788#link&quot; target=&quot;_blank&quot;&gt;Link(8)&lt;/a&gt; | &lt;a href=&quot;https://59log.com/?func=detail&amp;amp;id=788#trackback&quot; target=&quot;_blank&quot;&gt;Trackback(0)&lt;/a&gt; | &lt;a href=&quot;https://59log.com/?func=detail&amp;amp;id=788#comment&quot; target=&quot;_blank&quot;&gt;Comment(0)&lt;/a&gt;&lt;br /&gt;&lt;p&gt;&lt;/p&gt;&lt;p&gt;&lt;a href=&quot;https://59log.com/&quot;&gt;語句ログ - ニュース、プログラミング、システムトレードの用語解説 - 日本の注目ニュース、コンピュータープログラミング（C/C++,Perl,PHP,SQL）、システムトレード（FX,CFD,株価指数,先物）に関する語句（Word）を日本語や英語で解説&lt;/a&gt;&lt;/p&gt;</description>
    <link>https://59log.com/?func=detail&amp;id=788</link>
    <pubDate>Thu, 27 Jul 2006 22:09:56 +0900</pubDate>
  </item>
  <item>
    <title>Yahoo!ウェブ検索で2つの日本語検索機能が強化</title>
    <description>Yahoo!のウェブ検索で、「日本語スペルチェック」と「表記のゆれ」の2つの日本語検索機能を強化されました。&lt;br /&gt;&lt;br /&gt;「日本語スペルチェック」は、タイプミスやカタカナ/平仮名/漢字の誤変換に対応し、仮名漢字変換時の誤変換や漢字な思い出せないときに平仮名で入力した場合でも、正しい検索結果を得ることができるようする機能で、「表記のゆれ（以前は検索オプションでのみ利用可能）」は、これまでは同じに意味であるにもかかわらず表記が違っている場合は、検索結果が変わってしまっていたものを、通常の検索でも同じ検索結果になるようする機能です。&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;http://blogs.yahoo.co.jp/yjsearchblog/36686705.html&quot;&gt;「日本語スペルチェック」、「表記のゆれ」の2つの日本語検索機能を強化&lt;/a&gt;&lt;br /&gt;&lt;br /&gt;人の名前によっては簡単に漢字変換できない場合もあるので、検索が楽になりますね。SEOにも微妙に影響が出そうです。&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;https://59log.com/?func=detail&amp;amp;id=667#link&quot; target=&quot;_blank&quot;&gt;Link(2)&lt;/a&gt; | &lt;a href=&quot;https://59log.com/?func=detail&amp;amp;id=667#trackback&quot; target=&quot;_blank&quot;&gt;Trackback(2)&lt;/a&gt; | &lt;a href=&quot;https://59log.com/?func=detail&amp;amp;id=667#comment&quot; target=&quot;_blank&quot;&gt;Comment(0)&lt;/a&gt;&lt;br /&gt;&lt;p&gt;&lt;/p&gt;&lt;p&gt;&lt;a href=&quot;https://59log.com/&quot;&gt;語句ログ - ニュース、プログラミング、システムトレードの用語解説 - 日本の注目ニュース、コンピュータープログラミング（C/C++,Perl,PHP,SQL）、システムトレード（FX,CFD,株価指数,先物）に関する語句（Word）を日本語や英語で解説&lt;/a&gt;&lt;/p&gt;</description>
    <link>https://59log.com/?func=detail&amp;id=667</link>
    <pubDate>Sat, 24 Jun 2006 17:12:54 +0900</pubDate>
  </item>

 </channel>
</rss>
