配列表について「特許庁規格外の文字がある」とのエラーが出るときの原因と効果的な対処方法は何か
配列表を国際出願の翻訳文につけて提出するときに、出願端末における変換時に、配列表に関し、「特許庁規格外の文字がある」というエラーメッセージを受けることがあります。
原因は様々ですが、エラー箇所が1行目とされているときには、「BOM問題」であることが多いといえます。
1行目は、通常、「SEQUENCE LISTING」としか記載しないので、メモ帳で開いてみても、基本的には、何も見つかりません。やや特殊な文字や記号が使われていることに起因するエラーや警告であれば、それを見つけて、特許庁規格内の文字や記号に置き換えるだけなのですが、そのような対処の糸口はありません。ここで何をどうしたらいいのか悩みがちですが、実は簡単に直せます。
この原因はBOMです。BOM(バイトオーダーマーク)とは、テキストデータの最初の文字の前に入れ込まれたデータでして、具体的には、ユニコードで符号化されていることを示すために用いるデータのことです。昔は、使用される文字コードがばらばらだったため(米国のASCIIや日本のShift_JISなど)、このようなことが必要だったわけです。なので、エラー箇所が1行目の場合には、原因がBOMであることを疑うのがおすすめです。
見た目では通常わからないけれど、これらの情報が裏に存在しているため、「特許庁規格外の文字がある」というエラーメッセージを受けているわけです。ちなみに、符合化形式がUTF-8の場合、BOMとしては、0xEF 0xBB 0xBFが用いられます。そして、これらが引っ掛かった場合、エラーメッセージの中で、よく読めば、0xEF 0xBB 0xBFについて言及されています。
ちなみに、配列表を作成した人や保存した人が全く無意識であることもよくわります。というのも、アプリケーションによっては文字コードが UTFの場合に自動的に BOM を追加するものもあるようです。
ともかく、こういう現象が生じることを知っていれば、対処方法も簡単です。
つまり、テキストエディタ(なんでもいいですけど、例えば、秀丸エディタ)を開き、名前を付けて保存を選び、「BOMを付ける」のチェックを外すなりすれば、見た目は変わりませんが、BOM無しになります。再度、出願端末で変換をかければ、「特許庁規格外の文字がある」というエラーメッセージは無くなります。
原因は様々ですが、エラー箇所が1行目とされているときには、「BOM問題」であることが多いといえます。
1行目は、通常、「SEQUENCE LISTING」としか記載しないので、メモ帳で開いてみても、基本的には、何も見つかりません。やや特殊な文字や記号が使われていることに起因するエラーや警告であれば、それを見つけて、特許庁規格内の文字や記号に置き換えるだけなのですが、そのような対処の糸口はありません。ここで何をどうしたらいいのか悩みがちですが、実は簡単に直せます。
この原因はBOMです。BOM(バイトオーダーマーク)とは、テキストデータの最初の文字の前に入れ込まれたデータでして、具体的には、ユニコードで符号化されていることを示すために用いるデータのことです。昔は、使用される文字コードがばらばらだったため(米国のASCIIや日本のShift_JISなど)、このようなことが必要だったわけです。なので、エラー箇所が1行目の場合には、原因がBOMであることを疑うのがおすすめです。
見た目では通常わからないけれど、これらの情報が裏に存在しているため、「特許庁規格外の文字がある」というエラーメッセージを受けているわけです。ちなみに、符合化形式がUTF-8の場合、BOMとしては、0xEF 0xBB 0xBFが用いられます。そして、これらが引っ掛かった場合、エラーメッセージの中で、よく読めば、0xEF 0xBB 0xBFについて言及されています。
ちなみに、配列表を作成した人や保存した人が全く無意識であることもよくわります。というのも、アプリケーションによっては文字コードが UTFの場合に自動的に BOM を追加するものもあるようです。
ともかく、こういう現象が生じることを知っていれば、対処方法も簡単です。
つまり、テキストエディタ(なんでもいいですけど、例えば、秀丸エディタ)を開き、名前を付けて保存を選び、「BOMを付ける」のチェックを外すなりすれば、見た目は変わりませんが、BOM無しになります。再度、出願端末で変換をかければ、「特許庁規格外の文字がある」というエラーメッセージは無くなります。