622권 데이터 가져오기에서 결과가 원하는대로 되지 않았어요. 완벽한 데이터 구성이 최 우선이 되어야 하는데...

 

1. 전체 테이블 구성이 622권이 각각의 테이블로 구성되어 복잡하니까

holyspeeches - holyspeeches_vol_001 - speeches

이런 형식이 아니라

holyspeeches - vol_001 이런 식으로 구성하는 것이 좋지 않을지..

 

2. 기존 카페 데이터 가져오기 좀 더 정겨하게 다시..

https://mts.4men.kr/sayings/view.php?vol=2&no=33
1. 이런 식으로 중간중간 <p> 태그 등 잘 못 들어가는 문제 없도록
2. 날짜 이후는 무조건 장소로 1957년 4월 17일(水) 부활절, 서울 근교 야외
이 경우 장소에 들어가지 않음.. (부활절, 서울 근교 야외)
3. 본문의 &nbsp; 태그는 띄어쓰기로, <p tabindex="0">&nbsp;</p> <p></p><p>&nbsp;</p> 등은 제거
<span data-ke-size="size23"> 등 제거,
<strong>이나 <b>태그 등은 소제목으로 <h3> 태그로 대체
등등...