Can AI unblur text in a scanned document?

Yes. AI upscaling trained on real-world images can significantly improve the legibility of blurred, pixelated text in scanned documents. The model sharpens character edges and fills in missing detail in partially obscured letters. For severely damaged text where letters are completely illegible, AI provides the best guess but may not perfectly reconstruct every character. OCR software paired with manual correction is the fallback for critical documents.

What is the best scanning resolution for documents?

For text documents, scan at a minimum of 300 DPI. For documents with small text, fine print, or handwriting, scan at 600 DPI. Higher scanning resolution gives the AI more data to work with when enhancing text. Always save scans as PNG or high-quality JPEG to avoid compression artifacts that make text enhancement less effective.

Will AI text enhancement make OCR more accurate?

Yes. Running AI upscaling on a scanned document before feeding it to OCR software consistently improves recognition accuracy by 20-40%, especially on low-resolution scans and photographs of documents. Cleaner, sharper character edges give OCR engines more reliable data to work with.

스캔한 문서에서 흐릿해진 텍스트를 선명하게 보고 읽는 방법

나의 할머니는 내가 어렸을 때 1940년대에 약 80통의 편지를 남겼습니다. 할아버지는 해외에 계셨습니다. 얇고 아름다운 손글씨 항공 우편물. 문제는 편지가 다음에서 스캔되었다는 것입니다. 아마도 10년 전 어느 시점에는 컴퓨터의 DPI가 150으로 보였던 것 같습니다. 저렴한 평판 스캐너. 단어의 약 1/3은 읽을 수 없었습니다. 개별 문자가 번지고 잉크가 옅은 회색으로 희미해졌으며 얇은 종이 때문에 반대편에 적힌 글씨가 번지고 유령 같은 이중 이미지를 만들었습니다.

그대로 읽어 보았습니다. 3시쯤 지나니까 머리가 아프다 편지. 그런 다음 스캔한 텍스트를 읽을 수 있게 만드는 방법을 찾기 시작했습니다. 다시. 효과가 있었던 것과 시간 낭비였던 것은 다음과 같습니다.

스캔한 텍스트가 사진 향상과 다른 이유

대부분의 AI 업스케일러는 사진에 대한 교육을 받습니다. 그들은 매우 능숙하다 얼굴, 풍경, 사물. 텍스트가 다릅니다. 편지는 아주 특정 모양. AI가 날카로운 모서리를 둥글게 하거나 틈을 채우는 경우 잘못하면 한 글자가 다른 글자로 바뀌게 됩니다. 소문자 "c"는 "o"가 됩니다. "rn" 조합은 "m"이 됩니다. 이것들은 아니다 미용 문제. 그들은 단어의 의미를 바꿉니다.

텍스트에 대한 이상적인 접근 방식은 사진과 다릅니다. 사진의 경우, AI가 현실적인 세부 사항을 생성하기를 원합니다. 텍스트의 경우 문자 모양을 다음과 같이 변경하면서 가장자리를 날카롭게 하고 노이즈를 제거합니다. 가능한 한 적게. 그것은 거기에 있는 것을 청소하는 것보다 더 중요하다. 거기에 있을 수 있는 것을 생성합니다.

내가 시도한 것과 결과는 어땠나요?

처음에는 포토샵을 사용해봤습니다. 선명 필터로 인해 텍스트가 약간 변형되었습니다. 더 정의되었지만 모든 문자 주위에 후광이 도입되었습니다. 이후 선명하게 하면 텍스트가 희미한 빛을 내는 것처럼 보였습니다. 더 많았어요 읽기는 쉽지만 한 번에 몇 분 이상 읽기에는 불편합니다. 시간.

그런 다음 전용 사진 업스케일러를 사용해 보았습니다. 글자가 보이도록 만들었어요 더 깨끗하지만 모양이 약간 둥글게 되었습니다. "e"가 있었어야 했어 날카로운 크로스바는 부드럽고 불분명했습니다. 가볍게 읽기에는 괜찮고, 정확한 역사적 문서를 보존하기에 충분하지 않습니다. 표현이 중요합니다.

마침내 효과가 있었던 것은 일반 AI 업스케일러를 2배로 사용하는 것이었습니다. 보수적인 설정. 2배 업스케일은 픽셀 크기를 두 배로 늘렸습니다. 그 자체로 작은 텍스트를 더 쉽게 읽을 수 있게 되었습니다. AI 샤프닝은 글자 모양이 왜곡되지 않을 정도로 미묘합니다. 결과는 그렇지 않았습니다 완벽해. 이전에 읽을 수 없었던 단어의 85%가 읽을 수 있게 되었을 수도 있습니다. 나머지 15%는 원본 스캔 품질이 너무 저하된 단어였습니다. 아무리 강화해도 그것들을 복구할 수는 없습니다.

몇 주 동안의 작업 시간을 절약한 OCR 파이프라인

글자를 읽을 수 있게 만든 후 검색 가능한 텍스트를 만들고 싶었습니다. 모든 것을 디지털화하기 위해 OCR 소프트웨어를 통해 향상된 스캔을 실행했습니다. 이 작업을 잘 수행하는 방법에 대해 제가 배운 내용은 다음과 같습니다.

항상 OCR 전에 향상하십시오. 인식 정확도의 차이는 다음과 같습니다. 극적. 할머니의 편지, 원본 스캔에 OCR 단어의 약 60%가 맞았습니다. AI 강화 버전에서는 85% 정도 얻었습니다. 25% 향상은 내가 몇 단어를 수정했다는 의미입니다. 처음부터 다른 모든 단어를 입력하는 대신 페이지별로.

법률 문서나 문서처럼 모든 단어가 중요한 문서의 경우 계보 기록은 강화된 스캔에서도 OCR만을 신뢰하지 마십시오. AI와 OCR을 함께 사용하면 대부분의 작업이 올바르게 수행되지만 단일 이름, 날짜 또는 주소의 문자를 잘못 읽은 경우 잘못된 연구 경로. OCR을 시작점으로 사용하고 다음을 통해 확인하세요. 향상된 이미지를 직접 읽어 보세요.

반대편에서 피가 흐르면 어떻게 해야 할까요?

할머니의 편지에 들어 있는 얇은 항공 우편물은 뒷면에 적힌 글이 보였다. 이로 인해 AI 업스케일러가 혼란스러워졌습니다. 그것 텍스트의 두 레이어를 동시에 선명하게 하려고 시도하여 고스트를 회전시켰습니다. 첫 번째 문자 위에 겹쳐진 두 번째 번진 문자 세트에 작성합니다.

수정 사항은 향상 전에 스캔을 사전 처리하는 것이었습니다. 각각 열었어요 이미지 편집기에서 스캔하고 대비를 높였습니다. 배경은 최대한 흰색에 가까웠습니다. 이로 인해 텍스트를 통한 도련의 가시성. 그런 다음 AI 고급 버전을 실행했습니다. 는 결과는 완벽하지 않았습니다. 유령 문자는 여전히 희미하게 보였다. 하지만 앞면 텍스트가 확실히 지배적일 정도로 충분히 차분했습니다.

최악의 경우, 출혈이 너무 심해서 양측 모두 동일하게 보이도록 레이어를 복제하고 크게 흐림 효과를 적용했습니다. 고스트 텍스트를 분리하고 원본에서 뺍니다. 이것은 수동 복원 영역에 들어가고 있지만 5~6개 80통의 편지 중 최악인 편지는 노력할 만한 가치가 있었습니다.

나는 약 세 번의 주말에 걸쳐 80개의 글자를 모두 디지털화하는 것을 마쳤습니다. 는 AI 향상으로 대부분의 내용을 읽을 수 있게 되었습니다. OCR이 읽기 가능한 상태로 바뀌었습니다. 이미지를 검색 가능한 텍스트로 변환합니다. 수작업으로 이름을 확인하고 있었는데, 날짜, 장소. 이제 할머니의 편지를 검색할 수 있습니다. 온 가족이 사본을 가지고 있는 PDF입니다. 원본 스캔은 다음과 같습니다. 거의 사용할 수 없습니다. 향상된 버전으로 다시 살아났습니다.