일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- array
- Kotlin
- PostgreSQL
- math
- Apache
- SQL
- Redshift
- Python
- google apps script
- GIT
- Tkinter
- django
- 파이썬
- Java
- gas
- PANDAS
- numpy
- dataframe
- Excel
- Google Spreadsheet
- PySpark
- c#
- Github
- matplotlib
- hive
- string
- Mac
- Google Excel
- list
- Today
- Total
목록io (4)
달나라 노트
openpyxl이라는 라이브러리는 Python에서 Excel을 다룰 수 있게 해주는 기능을 가지고 있습니다. pandas에서도 read_excel() method를 사용할 때 등 openpyxl을 아주 밀접하게 사용하고있습니다. 이렇게 일반적으로 openpyxl은 다른 라이브러리 내부에서 엔진으로서 사용되고 있어서 이것을 직접 사용하는 경우는 아주 많지는 않을 수 있습니다만 그래도 엑셀 데이터를 다룰 수 있게 해주는 강력한 툴 중 하나이므로 그 방법을 알아봅시다. import pandas as pd import io df_test_1 = pd.DataFrame({ 'item_id': [1, 2, 3, 4, 5], 'name': ['a', 'b', 'c', 'd', 'e'] }) df_test_2 = pd..
DataFrame을 xlsx 파일로 생성하려면 to_excel() method를 사용합니다. import pandas as pd df_test = pd.DataFrame({ 'item_id': [1, 2, 3, 4, 5], 'name': ['a', 'b', 'c', 'd', 'e'] }) print(df_test) dir = 'output/df_test.xlsx' df_test.to_excel(dir, index=False, sheet_name='test') 이런 식이죠. 이렇게 하면 제가 지정한 'output/df_test.xlsx'라는 경로에 파일이 생성됩니다. import pandas as pd df_test_1 = pd.DataFrame({ 'item_id': [1, 2, 3, 4, 5], 'na..
아래와 같은 DataFrame이 있다고 생각해봅시다. import pandas as pd from io import StringIO dict_test = { 'id': [1, 2, 3, 4, 5], 'name': ['banana', 'apple', 'melon', 'peach', 'grape'], 'price': [3500, 16000, 15000, 25000, 5800] } df_test = pd.DataFrame(dict_test) print(df_test) -- Result id name price 0 1 banana 3500 1 2 apple 16000 2 3 melon 15000 3 4 peach 25000 4 5 grape 5800 만약 위 DataFrame을 comma(,)로 나눠진 csv ..
Pandas로 DataFrame을 다루다보면 DataFrame data를 database에 load해야 할 경우가 있습니다. 따라서 아래처럼 create table 구문을 실행시켜 database table을 생성하고 해당 tabe에 insert하는 방법을 사용한다고 가정해봅시다. create table test_table ( col1 varchar, col2 bigint, col3 double ) 위 예시는 column이 3개밖에 없어서 다행이지만 만약 column이 30개인 DataFrame을 insert하려고 한다면 위 create table syntax에 column 30개에 대한 datatype을 일일이 적어줘야 할것입니다. 이는 너무 번거로운 작업이 아닐 수 없죠. pandas에는 위처럼 특정..