AI한테 "이 사이트 읽어봐"라고 시키면 어떻게 되는지 아세요? HTML 태그, 광고 스크립트, 네비게이션 바, 푸터, 쿠키 배너… 이런 쓰레기가 핵심 텍스트랑 뒤섞여서 통째로 들어가요. 토큰은 토큰대로 낭비되고, AI 답변 품질은 당연히 떨어지죠.
URL 앞에 한 줄만 붙이면 이 문제가 사라져요. r.jina.ai/아무사이트.com — 이게 끝이에요.
이게 뭔데?
Jina Reader는 웹페이지 URL을 LLM이 바로 소화할 수 있는 깨끗한 마크다운으로 변환하는 무료 API예요. Jina AI라는 베를린 기반 AI 인프라 회사가 만들었고, 2024년 공개 이후 GitHub Stars 10,300개를 넘기며 개발자 커뮤니티에서 빠르게 자리잡았어요.
사용법이 말도 안 되게 간단해요. 읽고 싶은 URL 앞에 https://r.jina.ai/만 붙이면 끝이에요. 회원가입도 없고, API 키도 필요 없어요. 브라우저 주소창에 그대로 치면 마크다운이 바로 나와요. Simon Willison(Django 공동 창시자)도 "Jina AI 제품 중 가장 즉시 유용한 것"이라고 평가했어요.
기술적으로 보면, 내부에서 Puppeteer(헤드리스 Chrome)를 돌려서 자바스크립트 렌더링이 필요한 SPA까지 처리하고, Mozilla의 Readability.js로 핵심 콘텐츠를 추출한 다음, Turndown 라이브러리로 마크다운 변환을 해요. 여기에 더해서 Jina AI는 ReaderLM-v2라는 15억 파라미터짜리 전용 언어 모델도 만들었는데, 이건 규칙 기반이 아니라 뉴럴 네트워크가 HTML 구조를 이해하고 변환하는 방식이에요. 29개 언어를 지원하고, 기존 대비 20% 더 높은 정확도를 보여줘요.
Read 모드만 있는 게 아니에요. s.jina.ai/검색어를 쓰면 웹 검색 결과 Top 5를 마크다운으로 받을 수도 있어요. RAG 시스템이나 AI 에이전트의 웹 그라운딩에 딱이죠.
뭐가 달라지는 건데?
AI에게 웹 콘텐츠를 먹이는 기존 방법들, 한번 비교해볼게요.
| 직접 복붙 | 스크래핑 코드 | Jina Reader | |
|---|---|---|---|
| 준비 시간 | 매번 수동 | 사이트별 파서 개발 | 0초 (URL 접두사만) |
| HTML 노이즈 | 수동 정리 필요 | 사이트별 셀렉터 관리 | 자동 제거 |
| JS 렌더링 | 불가 | Selenium/Puppeteer 별도 구축 | 내장 헤드리스 Chrome |
| PDF 지원 | 별도 도구 필요 | 별도 라이브러리 | URL만 넣으면 처리 |
| 이미지 캡션 | 불가 | 별도 비전 모델 연동 | 자동 생성 (옵션) |
| 비용 | 무료 | 인프라 비용 | 무료 (기본) |
비슷한 서비스들과도 비교해볼게요.
| 도구 | 방식 | 무료 티어 | 라이선스 | 강점 |
|---|---|---|---|---|
| Jina Reader | URL 접두사 | 1,000만 토큰 | Apache 2.0 | 진입장벽 제로, 상업 이용 자유 |
| Firecrawl | API | 500 크레딧 | AGPL-3.0 | 대규모 크롤링, JS 자동화 |
| Crawl4AI | 로컬 설치 | 완전 무료 | Apache 2.0 | 셀프호스팅, LLM 청킹 |
| Diffbot | API | 체험판 | 상용 | 자동 엔티티 분류 |
정리하면 이래요. 가장 빠르게 시작하고 싶으면 Jina Reader, 대규모 크롤링이 필요하면 Firecrawl, 완전한 통제가 필요하면 Crawl4AI예요. Apify 블로그 분석에 따르면, 월 10만 페이지 기준으로 Firecrawl이 4~5배 저렴하지만, 소규모 사용이나 프로토타이핑에서는 Jina Reader가 압도적으로 편해요.
핵심 포인트
Jina Reader의 진짜 가치는 "코드 한 줄 없이 AI에게 깨끗한 웹 데이터를 먹일 수 있다"는 점이에요. 개발자가 아니어도, 브라우저 주소창에 r.jina.ai/를 붙이는 것만으로 AI 입력 데이터를 만들 수 있어요.
핵심만 정리: 시작하는 법
- 브라우저에서 바로 테스트
주소창에https://r.jina.ai/https://github.com/jina-ai/reader를 입력해보세요. 깔끔한 마크다운이 바로 나와요. 설치도, 가입도 필요 없어요. - AI 채팅에 활용하기
ChatGPT나 Claude에게 "이 페이지 분석해줘"라고 할 때, URL을 직접 주는 대신r.jina.ai/URL의 결과를 붙여넣어 보세요. 답변 품질이 확 달라져요. - 검색 모드 써보기
https://s.jina.ai/Jina+Reader+사용법처럼 검색어를 넣으면, 상위 5개 결과의 전문을 마크다운으로 받을 수 있어요. 리서치 자동화의 시작점이에요. - API 키 발급받기 (선택)
무료 키를 발급받으면 속도 제한이 분당 20회에서 500회로 뛰고, 응답 시간도 7.9초에서 2.5초로 줄어요. 1,000만 토큰이 무료로 제공되니까 부담도 없어요. - 자동화에 연결하기
코드에서 쓸 때는curl https://r.jina.ai/URL한 줄이면 끝이에요. Python, Node.js, n8n 같은 자동화 도구 어디서든 HTTP GET 하나로 웹 콘텐츠를 마크다운으로 가져올 수 있어요.
참고
일부 사이트는 봇 차단 정책으로 Jina Reader가 콘텐츠를 가져오지 못할 수 있어요. 그럴 때는 x-with-proxy: true 헤더를 추가하거나, 쿠키 포워딩 기능을 활용해보세요.




