목록전체 글 (39)
코딩초보 김씨
[ 네이버 블로그 크롤러 ] 맛보기 버전URL과 title만 크롤링 하는 코드이다.# ------------------------ 라이브러리 import ------------------------ #import sys # 시스템import os # 시스템import pandas as pd # 판다스 : 데이터분석 라이브러리import numpy as np # 넘파이 : 숫자, 행렬 데이터 라이브러리from bs4 import BeautifulSoup # html 데이터를 전처리from selenium import webdriver # 웹 브라우저 자동화import time # 네이버 서버와 통신할 때 중간중간 시간 지연. 보통은 1초. 파이썬 너무 빨라서 꼬이는 것 방지.from ..
코드 기록용으로 파일만 올려놓기!! 공공데이터를 이용하려면, 본인의 코드 키를 다운받아서 사용해야합니다.

[데이터 확인 1. 행 인덱싱] - df.head() / df.tail() - df.index / df.columns / df.values - df.T - df.sort_index(axis=1) - df.sort_value(by='행') [데이터 확인 2. loc[], iloc[]] - .loc[] / .iloc[] [데이터 확인 3. Boolean] [데이터 추가]

※ 시작하기에 앞서, 코딩 전 꼭 해야하는 작업에 대해 짚고 넘어가야한다.1. pwd 2. pandas와 numpy 불러오기3. 버전 확인하기판다스 데이터저장소의 종류는 series, dataframe 2가지이다.1. series : 1열로 이루어져있고, 리스트와 비슷함. 이름 = pd.Series([요소1, 요소2, 요소 3, 요소 4]) 2. dataframe엑셀 sheet처럼 행,열을 가진 frame을 만드는 것. 이름 = pd.DataFrame(sheet 채울 값, index= , columns= ) 오늘은 피곤해서 여기까지..내일 이어서 dataframe의 data를 선별하여 보는 방법 포스팅 예정!

* 집합은 리스트, 딕셔너리에 비해 많이 쓰이는 편은 아님.1. 생성 집합명 = set([요소1, 요소2, 요소3, 요소4, 요소5])2. 하나의 요소 추가 : .add()3. 여러개의 요소 추가 : .update() -> add에 비해 큰 무언가를 update 하는 느낌으로!4. 합집합 : a|b5. 교집합 : a&b6. 차집합 : a-b

* 딕셔너리란? Key와 Value 데이터 쌍으로 이루어진 데이터 저장소1) 생성 Kim = { 'Key1' : 'Value1', 'Key2' : 'Value2', 'Key3' : 'Value3' }2) Key-Value값 추가 Kim['Key4'] = 'Value4'3) Key값 출력 Kim.keys()4) Value값 출력 Kim.values()