MacでPDFからコピーペーストしたテキストが、濁点が分割されてしまう

今更かもしれませんが……

プレスリリースや素材資料を、PDFファイルでいただくことが時々だります。
それをコピーペーストしてそのままWebサイトに掲載したり、編集して掲載します。
その際に妙なスペースが入っていたりして、そのまま貼り付けるだけではなく、校正で一手間かける必要はあります。

ところが、問題はそれだけじゃなかった。
上記のものは目視で確認できるのですが、出来ない問題が隠れていました。

どうもMacOS XのUnicodeによる文字の正規化の種類の違いによって起こっていて、
MacOS Xで開いたPDFはテキストが濁点を分割した文字に変換されており、それをコピーペーストして使用すると、WindowsXPのそれに対応出来ないマシンで、濁点が「か“」のように分割表示になっちゃうのです。(すごくおおざっぱな言い方だけど)

Macユーザー歴が浅いから全然知らなかった、と言いたいところだけど。
古いXPマシンを使っていた時代に何度かそういうページを見かけたことはありました。
そしてMacに移行する手前の併用していた時期に、Macでプレスリリースをもとに作った記事でその症状を確認し、どうしてWindowsでこんな風に表示されるんだろうと、友人に見て貰うも「うちのマシンでは問題ないよ」と言われ、首を傾げながらWindowsで手直ししたのです。
そしていつしか、その古いXPマシンでその症状を見かけることはなくなりました。(現在は分割表示されているはずのものも、問題なく表示されます。何故!?)
ちなみにも、新しい方のXPマシンでは全く確認出来ず。
だから今まで、該当PDFファイル単独の問題かと思ってましたよ。

そのうち淘汰される問題なのでしょうが、今は未だ該当環境のユーザーが少なからずいるので対策はせねばです。

ちなみにこちらで変換ツールを提供されています。
PDFからコピーした濁点/半濁点付きの文字列をFirefoxに貼り付けた時におかしくなる問題の対処方法(強火で進め)

そして、取り急ぎアナログな方法で対応する中で確認出来たのが、

PDFの文面をコピー

・直接ブラウザーに貼り付けはNG。
・aptanaに貼り付けはNG。
・デフォルトのテキストエディタに貼り付け→コピペはNG。
mi(テキストエディタ)に貼り付け→ブラウザやaptanaにコピペはOK!

でした。(濁点分割の問題に関してのみ)

ま、うまくいってるかの確認が自分のところで出来ないことには変わりないんですけどね……
タグ:Mac

2013年02月18日

posted by michi at 13:52 | Comment(0) | Note | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント:

※ブログオーナーが承認したコメントのみ表示されます。
×

この広告は1年以上新しい記事の投稿がないブログに表示されております。