일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- array
- SQL
- Github
- GIT
- PySpark
- 파이썬
- django
- Tkinter
- matplotlib
- numpy
- hive
- gas
- Python
- Excel
- PostgreSQL
- Google Excel
- Google Spreadsheet
- PANDAS
- c#
- math
- Redshift
- dataframe
- string
- Mac
- Apache
- Kotlin
- google apps script
- list
- Java
- Today
- Total
목록read_csv (3)
달나라 노트
requests library와 API를 이용하다보면 csv format의 데이터를 얻어올 때가 있습니다. 그 결과값은 API를 어떻게 만드냐에 따라 달라질 수 있지만 주로 보이는 형태는 아래와 같습니다. import requests api_endpoint = 'https://test_api/get_data' response = requests.get(api_endpoint) print(response.status_code) print(response.content) print(type(response.content)) -- Result 200 b'modelno,name,price,weight\r\nAGH1341,Laptop,1300000,1200\r\nSOE1029,Desktop,1800000,3500..
간혹 read_csv method로 csv 파일을 읽을 때 아래와 같은 error가 발생하는 경우가 있습니다. UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc0 in position 0: invalid start byte encoding관련 문제가 생겨서 발생하는 error인데 이러한 error가 발생하면 먼저 원본 csv 파일에 한글이 섞여있는지 확인해보면 좋습니다. import pandas as pd df_test = pd.read_csv('test.csv', sep=',', encoding='euc-kr') df_test = pd.read_csv('test.csv', sep=',', encoding='cp949') 만약 한글이 포함되어있다면 위처럼..
pandas.read_excel &emp; pandas.read_csv read_excel은 .xlsx 파일을 읽어 DataFrame의 형태로 가져오는 기능을 제공합니다. read_csv는 .csv 파일을 읽어 DataFrame의 형태로 가져오는 기능을 제공합니다. 엑셀을 실행하여 다음과 같은 데이터를 입력한 후 test.xlsx, test.csv라는 이름으로 동일한 데이터를 가진 2개의 파일을 생성하였습니다. 각각의 파일은 root directory(~/)의 Documents 폴더해 저장해놨기 때문에 경로를 이처럼 지정해주고 아래처럼 read_excel과 read_csv를 이용하여 파일을 읽어봅시다. xlsx_dir = '~/Documents/test.xlsx' csv_dir = '~/Documents..