목록전체 글 (39)
코딩초보 김씨

집에 와서 복습을 하려고 코드를 돌려보니 에러가 났다. "아, 맞다! 라이브러리를 설치해야되지!" 왠걸.. 라이브러리를 설치하는데에 아주 큰 애를 먹어서다음에 컴퓨터를 바꿨을 때 참고하기 위해 기록용으로 작성! 1. wordcloud!pip install wordcloud아주 간단하다. 2. Graphviz1) Graphviz 설치 : https://graphviz.org/download/ Download graphviz.org 2) anaconda prompt 관리자권한 실행 >pip install graphviz 3) 시스템 환경 변수에 경로 저장사용자변수 path에 경로 추가 : ~~~\bin시스템 변수 path에 경로 추가 : ~~~\bin\dot.exe 4) anaconda pro..

오늘은, 지난 시간에 크롤링을 통해 모은 리뷰를 워드 클라우드로 만들어보기로 했다. 워드 클라우드란?이런 식으로 자주 나타나는 단어를 강조할 수 있는 시각화 중 하나의 방법이다. - 코드는 수업시간에 배운 선생님 코드를 응용하였다 - 1. 라이브러리 importimport scipy as spimport pandas as pdimport numpy as np# konlpy 한글 텍스트 분석 패키지from konlpy.tag import Kkma ; kkma = Kkma()from konlpy.tag import Hannanum ; hannanum = Hannanum()from konlpy.tag import Okt ; t = Okt()from konlpy.tag imp..
6. [문제 번호 2742] 기찍 N - 문제 : 자연수 N이 주어졌을 때, N부터 1까지 한 줄에 하나씩 출력하는 프로그램을 작성하시오. - 입력 : 첫째 줄에 100,000보다 작거나 같은 자연수 N이 주어진다. - 출력 : 첫째 줄부터 N번째 줄 까지 차례대로 출력한다. - 나의 코드 N = int(input()) for i in range (N, 0, -1): print(i) * 시작 숫자와 끝 숫자를 뒤집으면 될 것 같아서 range (N, 0)로 해보니 아무것도 출력되지 않는다. 역순으로 출력할 때는 range (start, stop, step) step을 -1로 준다. 7. [문제 번호 11021] A+B -7 - 문제 : 두 정수 A와 B를 입력받은 다음, A+B를 출력하는 프로그램을 작성..
1. [문제 번호 2739] 구구단 - 문제 : N을 입력받은 뒤, 구구단 N단을 출력하는 프로그램을 작성하시오. 출력 형식에 맞춰서 출력하면 된다. - 입력 : 첫째 줄에 N이 주어진다. N은 1보다 크거나 같고, 9보다 작거나 같다. - 출력 : 출력 형식과 같게 N*1부터 N*9까지 출력한다. - 나의 코드 N = int(input()) for i in range(1, 10): print (N,'*', i, '=', N*i) 2. [문제 번호 10950] A+B -3 - 문제 : 두 정수 A와 B를 입력받은 다음, A+B를 출력하는 프로그램을 작성하시오. - 입력 : 첫째 줄에 테스트 케이스의 개수 T가 주어진다. 각 테스트 케이스는 한 줄로 이루어져 있으며, 각 줄에 A와 B가 주어진다. (0 <..

1. [문제 번호 1330] 두 수 비교하기 - 문제 : 두 정수 A와 B가 주어졌을 때, A와 B를 비교하는 프로그램을 작성하시오. - 입력 : 첫째 줄에 A와 B가 주어진다. A와 B는 공백 한 칸으로 구분되어 있다. - 출력 : 첫째 줄에 다음 세 가지 중 하나를 출력한다. 1) A가 B보다 큰 경우에는 '>'를 출력한다. 2) A가 B보다 작은 경우에는 '') elif A < B: print(''를 출력한다. 2) A가 B보다 작은 경우에는 '

어제 작성했던 코드를 합치는 작업이다.이전 게시글에서 크롤링한 URL을 열어서, 홈페이지 내부에 있는 정보들을 크롤링 하는 최종 코드이다.2021.05.12 - [김초보의 코드] - 네이버 호텔 크롤링 3 물론 초보에게는 짜놓은 코드를 합치는 것도 쉽지는 않았고..자꾸 오류가 났다. 오늘은 오류가 발생했던 코드와, 그 이유를 먼저 정리하고 마지막에 최종 코드를 삽입할 예정이다. * 합친 코드에서 오류 발생 * 코드가 다 돌아간 뒤, error가 나서 정보 수집이 안되어서 빈 딕셔너리만 출력이 되었다.강사님께 질문하였더니 코드를 나눠서 어디에서 오류가 나는지 확인해보라고 하셨다.# 글 띄우기url_load = pd.read_excel("210512_hotel_list.xlsx")# 전..

개별 호텔의 URL에 들어가기 전에 여러 호텔의 정보를 크롤링하는 크롤러를 만들었다. 이번에는 각 호텔의 URL에 들어가서 정보를 긁어오는 크롤러를 만들 것이다.항목 별 평점과 리뷰를 모으는 용도이다. 1. 전에 모았던 URL을 이용하여 글 띄우기# excel 파일 가져오기url_load = pd.read_excel("210512_hotel_list.xlsx")# url 가져오기# 지금은 개별 코드이므로 0 입력. 코드 합칠 땐 반복을 위해 0 대신 i 입력url = url_load['url'][0]# Chrome driver를 이용하여 url 열기path = "chromedriver.exe"driver = webdriver.Chrome(path)driver.get(url) 2. 항목..

네이버 호텔 홈페이지에서 크롤링 할 정보는 총 4가지이다. (URL 들어가기 전)호텔 url을 위한 id, 호텔 이름, 가격, 별점(평점) 1. 호텔 id# 호텔의 고유 id 찾기hotel_ids = driver.find_elements_by_css_selector('.lst_hotel > li')# 호텔 id를 저장할 list 생성hotel_id_list = []# for문을 통하여 리스트에 정보 추가for hotel_id in hotel_ids: hotel = hotel_id.get_attribute('id') hotel_id_list.append(hotel) 2. 호텔 이름# 호텔 이름 찾기hotel_name_raw = driver.find_elements_by_css_selecto..

포기할 뻔 했던 네이버 크롤링 url 수집 해결방법을 찾았다!(물론 강사 선생님이 힌트를 주셨다) "막힌 이유" 보통 홈페이지라면 html 요소(F12)에서 a함수의 href에 url이 있어서 href를 추출하면 되지만,네이버 호텔의 경우 각 호텔에 들어가기 위한 href가 'javascript: ;' 라는 당황스러운 값이 있었다. "해결 방법" 직접 호텔을 눌러 호텔 정보 페이지에 들어가보니, 인터넷 주소가 아래와 같았다.https://hotel.naver.com/hotels/item?hotelId=hotel:Lotte_Hotel_Jeju&rooms=2https://hotel.naver.com/hotels/item?hotelId=hotel:The_Shilla_Jeju&rooms=2 빨간색 부분..

사람마다 여행에서 중요하게 생각하는 요소가 모두 다르다. 내가 가장 중요하게 생각하는 요소는 "숙소" 이다. 그래서 네이버 호텔 페이지의 호텔을 크롤링하여, 텍스트 분석을 통한 추천 시스템을 만들어보고싶은큰 꿈을 가지고 시작해보려고 한다. 첫번째는 네이버 호텔의 호텔 이름과 URL 크롤링!! 1. 라이브러리 importimport sysimport osimport pandas as pdimport numpy as npimport time # 파이썬 너무 빨라서 꼬이는 것 방지.from bs4 import BeautifulSoup # html 데이터를 전처리from selenium import webdriver # 웹 브라우저 자동화from tqdm ..