마음 속 하늘은 항상 맑음~!

HWPText 본문

프로그래밍

HWPText

파르셀수스 2013. 8. 27. 21:50

 윈도우즈용 아래한글(아마 97이상일걸루 추정)의 텍스트를 뽑아서 보여주는 유틸. 대충 몇몇 파일들에 대해서 테스트해본 결과 잘되는 것 같음. 암호가 걸린 파일은 읽을 수 없음. 저장은 하지 않고 보여주기만 함.


 결과물은 utf-8형식(의 문자파일-HWP2TXT).


 형태를 보여주기 보다는 문자를 추출하는데 중점이 됨.

 






hwptxt.zip


 - 한글이름 파일이 안열리던 것을 수정.

 - 유니코드 파일이름에 대응.


HWP2TXT.zip



 - 도스창 버전.

 - 결과물은 문자파일. -w는 결과물 파일을 덮어쓰기. -s는 이미 있는 파일은 하지 않음. -s가 우선권을 가짐.


* 3.0 파일의 지원. 3.0 파일은 한자는 4888 기본 한자만 변환. 특수문자는 일부만 변환.


* 3.0에서 변환되는 특수문자를 더 추가. 워낙 한컴코드가 일련화되지 않아서 다 매칭이 =_=;


* 내부 자잘한 버그 수정.