본문 바로가기

해시노드3

티스토리 크롤링, 제목 영어로 번역, 마크다운 파일 생성 & 해시노드 업로드 티스토리를 크롤링해서 해시노드로 데이터를 이전하는 코드를 작성했습니다. 해시노드에 한글 제목을 slug로 해서 업로드했을 때, 약 7,000개의 글 중에서 5,000개 미만의 글이 업로드됐는데, 아마도 이건 slug가 중복되어 그런 것이라 예상합니다. 티스토리를 크롤링하면, 제목이 한글로 추출되는데...이렇게 하면 해시노드에 적용되는 slug 부분이 아주 엉망이 되어 버립니다. 그래서 크롤링하면서, slug 부분은 제목을 영어로 번역하도록 코딩했습니다. 저장되는 마크다운 파일의 제목은 YYYY-MM-DD-제목.md로 저장됩니다.이렇게 해서 zip파일로 압축한 후 업로드하면...깔끔히 업로드되고, 글의 uri도 slug가 될 것입니다.각 글에 들어가서 slug를 수정하려고 했는데, 이렇게 하니까...약 7.. 2025. 2. 8.
티스토리 크롤링 & 마크다운 파일 만들기, 해시노드 업로드 티스토리 블로그를 크롤링하여, 깃허브 블로그 Jekyll 스킨에 맞도록 마크다운 파일을 만드는 코드입니다.티스토리 스킨은 '#1' 스킨을 적용한 후 크롤링을 진행하였습니다. 깃허브 블로그에 올라가는 파일은 YYYY-MM-DD-제목.md 형식으로 저장됩니다.마크다운 파일을 만들면서 제목, 작성일, 카테고리, 태그 등이 자동으로 저장되도록 하였습니다. import requestsfrom bs4 import BeautifulSoupimport osimport timefrom datetime import datetimeimport redef get_page_content(url): headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64;.. 2025. 2. 8.
개발 19~25일차, 티스토리 이전 테스트 진행 티스토리 블로그 이전을 위해 다양한 방법을 시도해 봤습니다. 1. 이미지 파일 변환우선 티스토리를 백업받은 다음, 폴더 안의 이미지를 jpg와 png에서 webP 파일로 바꿨습니다.관련 내용은 이전 글에 기록하였습니다. https://act2.tistory.com/132 티스토리 블로그 백업 데이터의 이미지를 webP형식으로 한 번에 바꾸기티스토리 블로그를 백업하고 궁금했던 점 한 가지는...'이미지가 jpg와 png 형식으로 되어있는데, 이걸 webp 형식으로 변환할 수 없을까?' 하는 것이었습니다. 글이 약 6,800여 개가 되니, 이걸 하나act2.tistory.com  2. 이미지 주소 변경그다음에는 html '이미지 주소'와 변환한 파일이 일치하도록 html의 이미지 주소를 수정했습니다. imp.. 2025. 1. 30.