[Perl]UTF-8でエンコードされた文字列の文字数を取得するコード - コメント[1]
Perlのlength関数ではバイト単位となるので、UTF-8でエンコードされている場合、漢字、ひらがな、カタカナなどは1文字で3となってしまいます。ブログなどのアプリケーションのテキスト処理ではそれでは不都合な場合も... 全文を表示
よく見ると、_bytesize関数がちょっと冗長ですね。
Perlのlength関数ではバイト単位となるので、UTF-8でエンコードされている場合、漢字、ひらがな、カタカナなどは1文字で3となってしまいます。ブログなどのアプリケーションのテキスト処理ではそれでは不都合な場合も... 全文を表示
よく見ると、_bytesize関数がちょっと冗長ですね。