• 목록
  • 아래로
  • 위로
  • 8
  • 누붕이
  • 조회 수 129

* 블루레이/dvd 추출 자막을 변환하는 법

subresync

- 단점, 끄면 다시 입력

 

subtitle edit

- subresync와 달리 db를 저장할 수 있어 같은 폰트 db가 쌓일수록 점점 변환 속도가 줄어듭니다. 쉬운 폰트는 40분 -> 20분 -> 10분, 어려운 폰트는 1시간 20분 -> 50분 -> 30분

- subresync와 같은 단축키

- 빠르면 같은 글자 한번씩 입력하고 아무것도 없는 db 상태에서 타이핑이 느려도 30~40분이 변환 가능

힘든 폰트는 1시간~1시간 30분 정도

미드 같은 경우 총 10~22편 드라마 변환 2~2시간 반, 수정 1시간 정도

경우에 따라 다르지만 한글 sub/sup 변환이 가장 쉽고, 시간이 가장 짧게 걸림

영문의 같은 경우 i, l 구분 인식이 잘되지 않아서 변환하고 스펠체크가 필수입니다. 

변환에는 몇가지가 있지만 최신기준 3가지

  이미지 비교에 의한 OCR... - subresync와 같은 방식 db에 저장되고 쌓이면 변환이 빨라짐

  Tesseract - 자동 인식 변환, 한글 인식률 처참, 영문 계열만 사용하는 게 좋습니다. 변환 후 스펠체크 했지만 오자를 빠트릴 수 있습니다. 

   NOCR에 의한 OCR - 백터 방식, 영문 전용, 한글은 글자수가 많고 복잡해서 도움 안됨(3.5.16이상)

 

- 변환 속도, db가 없는 처음 변환할 때 기준

이미지 비교에 의한 OCR - 이탤릭 없는 쉬운 폰트 한글(30-40분, 타자속도 빠르면 20분내), 영문변환후 스펠체크

Tesseract - 영문 변환 후 스펠체크, 스펠체크 시간까지 합산하면 이미지 비교에 의한 OCR보다 느릴 수 있습니다.

 

imgmerge, png2srt -구글 ocr, 변환은 자동이나 수정하는게 오래걸립니다. 변환 후 수정을 아예 하지 않던가, 아니면 참 오래 걸림

최신 imgmerge버전은 바로 아래 링크 - Download ZIP

https://gist.github.com/wyb330/e7710eeb6b2fede89f405387116533be

http://cineaste.co.kr/bbs/board.php?bo_table=psd_capmakef&wr_id=27049 - 이 게시물은 해당링크를 보충설명입니다.

프로그램을 만들어주신 darong 님에게 감사드립니다.

 

이미지 150개 파일을 하나로 묶으려면 메모장등 편집기에서 imgmerge.py 내용 중 .png을 .jpg로 수정합니다.

 

포춘 쿠키 (The Fortune Cookie, 1966)폰트 인식률이 매우 나빠 NOCR에 의한 OCR, 이미지 비교에 의한 OCR..., imgmerge 여러가지 방법으로 시도해서 시간이 오래걸렸습니다.

 

* 차체 동영상 자막을 텍스트로

- 영문 싱크에 화면 자막을 보면서 타이핑, 단점 영문과 한글 싱크가 달라 재조정하거나 영문싱크에 맞춰 글자를 나눠서 타이핑

- videosubfinder에서 캡쳐된 싱크를 가지고 타이핑, 누락된 싱크만 삽입 후 타이핑

- videosubfinder + 구글 ocr(imgmerge 무료/png2srt 유료)

https://github.com/Zarxrax/png2srt 

https://www.clien.net/service/board/cm_nas/13721077 

http://www.2cpu.co.kr/nas/27035 

png2srt 기본세팅 언어가 일본어인 이유는 일본에 사는 외국인을 위한 만들 프로그램이고 넷플릭스 이미지 변환 용이지만 sub/sup 자막도 변환이 됩니다.

 

videosubfinder 에서 캡쳐된 이미지를 imgmerge로 합치고 구글로 자동 ocr나온 결과물 수정

  팔이 아프게 타이핑할 필요없이 텍스트로 자동 변환이 됩니다.

- imgmerge ocr 과정

  1. videosubfinder로 이미지를 캡쳐합니다.

  2. 파이썬 설치 -  필히 path 추가 체크합니다. 3.7버전을 설치합니다.

cmd 창에서 입력하는 법 - 복사 붙여넣기 엔터, 소스에 있는 내용 입니다.

 

pip install 안먹이면 아래 링크대로 오래전이라 기억안나지만 구글링에서 찾아 링크합니다.

https://dora-guide.com/pip-install/

https://antilibrary.org/2325

https://bootstrap.pypa.io/get-pip.py 에서 다운 받고 python get-pip.py 와 명령후 아래와 같이 입력

pip install opencv-python

pip install numpy

pip install bs4

 

  3. imgmerge 또는 png2srt로 이미지를 합칩니다. png2srt는 6번 과정으로 넘어갑니다.

  cmd 창에서 입력하는 법은 아래 링크 참조, 타이핑하거나 경로를 입력할 필요없습니다. 탐색기 경로 복사는 아래 링크 참조

  그게 귀찮으면 배치파일을 만듭니다. 텍스트 파일 확장자를 .bat로 바꿉니다. ansi형식으로 반드시 저장합니다. 그렇지 않으면 실행 에러 발생합니다. 경로명에는 한글이 있거나 경로끝에 역슬래시가 있으면 또한 에러 발생

  해당 폴더가 있어야 에러가 없이 정상적으로 실행됩니다. 경로명에 공백있으면 안돼서 경로 앞뒤로 "따옴표를 붙입니다.

  imgmerge.py -i "C:\videosubfinder\RGBImages\*.*" -o "C:\mergeimage" -b 150

  합친 이미지가 10mb가 넘으면 변환이 되지 않으니 크기를 9,600Kbyte이하로 맞춥니다. -b 150에서 10씩 줄입니다. -b 140, - b 130

   

  4. 합친 이미지를 구글 드라이브에 업로드합니다.

  5. subtitle edit에서 타임코드 인식할 수 있게 글자를 삭제합니다. 예) |

  6. 나눠진 텍스트를 하나의 자막으로 합칩니다. 도구 --> 새자막 등록

  7. 잘못 인식된 글자를 일부 지우거나 교정합니다. 도구 --> 일반적인 오류 수정, 바꾸기 또는 다중 바꾸기

  8. 검수합니다.

  - 자체 자막을 재생 비교하면서 검수합니다. 시간을 줄이려면 빠른 배속 재생합니다.

  - 또는 블루레이 영상을 보면서 다른 자체 자막 창을 띄우고 검수합니다.

 

- 다른 조합으로 videosubfinder + FineReader 가능합니다.

- 구글 api를 이용한 png2srt처럼 다른 포털 사이트도 일정기간 무료 및 그 이상은 유료로 제공하고 있습니다.

  MS(5000건) > 구글(1000건) > 다음(500건) > 네이버(100건) 순으로 무료 제공량이 가장 많은, 제공건수를 확실지 않습니다.

  윈도우 10에서도 ocr 툴이 내장되어 있습니다. 그 툴이 포함되어 있는 번역기가 'MORT - 실시간 게임 번역기'

 

아래는 구글링으로 찾은 팁

 

* 탐색기에서 경로를 복사하는 법  

https://hkebi.tistory.com/1594

 

* 드래그 앤 드롭으로 cmd에 경로 붙이기

https://www.snoopybox.co.kr/1550

 

* 탐색기에서 cmd 입력법

https://ttend.tistory.com/476 

 

* 원하는 곳에서 cmd입력법과 cmd창에 경로복사하는 법

https://www.youtube.com/watch?v=-9fKZcPGVhg 

 

* 받침ㅆ+에 --> 받침ㅆ어로 자동교정하기, 자막을 input.srt 변경후 .py 파일을 클릭하면 교정된 output.srt로 출력됩니다. 예) 였에, 됐에 --> 였어, 됐어, 우측 download버튼을 누르면 다운로드

https://pastebin.com/h0suaJAA 

 

저는 그냥 봐도 상관없는데

큰 화면으로 보시는 분들, vod 자체 자막은 화질/음질에 만족 못 하시분들을

 

출처 http://cineaste.co.kr/bbs/board.php?bo_table=co_free&wr_id=179739

 

-

나는 뭔소린지 모르겠노

    댓글 8

    삭제

    "ㅇㅇ님의 댓글"

    이 댓글을 삭제하시겠습니까?

    누붕이 작성자 → 코로나온다
    profile image
    아직은 업서..
    2020.08.02. 19:38
    cinesam
    나도 씨네스트에서 보고 따라해봤는데 어렵더라

    어렵게 구한 파일 자막이 싱크가 점점 늦어져서 그거 해결할려고 시도했는데 결국 못해서 그냥 일일히 손작업중 T T
    2020.08.02. 21:59
    고정관념
    profile image
    나도 뭔소린지 모르겠지만 멋져보인다
    2020.08.02. 22:13
    몰라도된다임마
    동영상 자체에 자막이 박혀있는 자막에서 자막 추출하는 방법인데 요즘 기술이 좋아져서 96%정도는 프로그램으로 다 처리 가능하다 따라해보면 쉽다
    지금 당장 동영상 플레이어에서 자막 나오는 부분 캡쳐해서 구글 드라이버에 올린 후에 그 그림을 이미지가 아니고 문서(doc)로 열어봐라 그러면 신기하게 분명히 그림인데 자막부분을 글자로 인식해서 대사 한줄이 텍스트화 될꺼다
    구글에서 제공하는 ocr기술인 비전api 공짜로 이용하는거지
    위에 프로그램은 자막나오는부분 자동으로 캡쳐해주고 그때 러닝타임 러닝타임 문서로 만들어 뒀다 여러개의 자막을 하나의 길다란 이미지로 붙여주는 기능한다 나머진 사진한장 올리는것도 동일
    2020.08.03. 13:01
    누붕이 작성자 → 몰라도된다임마
    profile image
    쉽게 설명 ㄳ
    2020.08.03. 15:08
    번호 제목 글쓴이 날짜 조회 수
    공지 자막 공유의 저작권, 책임은 모두 띵작닷컴에 있습니다 4 오두민 20.04.14.20:19 1345
    공지 자막 다운로드 free 168 오두민 20.02.23.19:51 3957
    70 호스트 2020 한글자막 Host.2020.1080p.WEB.H264-SECRECY[rarbg] 7 image 누붕이 누붕이 2일 전20:57 207
    69 자막을 퍼와도 되나요? 3 ㅇㅇ 3일 전20:14 77
    68 넷플릭스의 초월번역.jpg 3 image ㅇㅇ 6일 전18:50 97
    이미지 자막을 텍스트로 바꾸는 법 8 누붕이 누붕이 20.08.02.19:03 129
    66 넷플자막 페미의심 6 image ㅇㅇ 20.08.02.17:28 88
    65 번역기 모음 사이트 만들었어 10 image 취곧개 20.08.01.18:11 169
    64 원령공주 블루레이 자막 (내가만듬 구글에서는 검색잘안되서 올림) 19 image Elie.자비스 20.07.27.01:35 188
    63 종말 한글자막 (Calm With Horses 2019) .1080p.AMZN.WEB-DL.DDP5.1.H.264-NTG 12 image 누붕이 누붕이 20.07.26.19:31 237
    62 오늘도 괴롭히는 도시락 今日も嫌がらせ弁当, BENTO HARASSMENT, 2019 (내가 안만들었음 퍼왔음) 11 image cinesam 20.07.24.20:10 169
    61 성의 극약 한글 자막 dangerous drugs of sex 2020 korsub 26 file 키류카즈마🤝 키류카즈마🤝.. 20.07.22.21:32 1092
    60 혹시 더 위커맨(The Wicker Man) 2006년작 자막 있으신분 1 ㅇㅇ 20.07.22.18:02 50
    59 성의극약 자막 내일 완성이 목표 14 키류카즈마🤝 키류카즈마🤝.. 20.07.21.23:30 393
    58 키슨상님 일어나시거든 이거 번역점.. 10 image ㅇㅇ 20.07.21.00:10 119
    57 자막 만드는 법 -2-서브타이틀 에디트(Subtitle edit) 사용하여 자막 생성하기 22 image 키류카즈마🤝 키류카즈마🤝.. 20.07.18.15:35 168
    56 자막 만드는 법 -1-영상 구하기, 자료 확보하기 15 키류카즈마🤝 키류카즈마🤝.. 20.07.18.13:12 150
    55 누가 자막제작방법 정리해서 올려주면 좋겠다. ㅇㅇ 20.07.18.12:15 193
    54 더 아웃포스트 한글자막 The.Outpost.2020.1080p.AMZN.WEB-DL.DDP5.1.H.264-NTG 18 image 누붕이 누붕이 20.07.18.08:39 4106
    53 아르파울 개봉 한지 언제인데 아직도 자막이 없나여?_? 6 음유샤인 20.07.11.21:28 101
    52 씹창나버린 넷플릭스 자막.jpg 7 image ㅇㅇ 20.07.11.20:00 195
    51 올드가드 The Old Guard 한글자막 36 image 올인 올인 20.07.11.05:11 10348