일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- hive
- math
- Mac
- Kotlin
- list
- c#
- Google Spreadsheet
- GIT
- 파이썬
- numpy
- matplotlib
- Excel
- Python
- google apps script
- PANDAS
- Java
- gas
- Apache
- dataframe
- PySpark
- PostgreSQL
- string
- Github
- array
- django
- Google Excel
- Tkinter
- Redshift
- SQL
- Today
- Total
목록series (7)
달나라 노트
Pandas의 str.contains method는 특정 Series에 적용할 수 있으며 해당 Series에 있는 값들이 어떤 문자열을 포함하고있으면 True, 포함하고있지 않으면 False를 return합니다. Syntax Series.str.contains(string/pattern, case=True/False, regex=True/False) string/pattern : 찾을 문자열 또는 패턴 case : True일 경우 case sensitive(대소문자 구분), False일 경우 case insensitive(대소문자 구분 안함) regex : True일 경우 string/pattern을 regular expression pattern으로 인식. False일 경우 string/pattern을..
Pandas의 Series에는 value_counts라는 method가 존재합니다. 이것은 Series에 존재하는 값들 중 동일한 값들이 몇 개 있는지를 세어줍니다. import pandas as pd list_test = [1, 2, 3, 3, 3, 4, 5, 5, 6, 7, 8, 8, 8, 9] seri_test = pd.Series(list_test) - Output 0 1 1 2 2 3 3 3 4 3 5 4 6 5 7 5 8 6 9 7 10 8 11 8 12 8 13 9 dtype: int64 먼저 위처럼 test용Series를 만들어줍시다. val_cnt = seri_test.value_counts() print(val_cnt) print(type(val_cnt)) - Output 8 3 3 3..
Python Pandas Python에서 Pandas library는 아마 엑셀같은 형태의 데이터를 다루기 위해 가장 많이 사용되는 library중 하나가 아닐 까 싶네요.저도 pandas를 거의 필수적으로 사용하고있다보니 상당히 유용한 library인 것은 틀림없는 것 같습니다. Pandas의 자료구조 : Series, DataFrame Pandas에는 대표적으로 Series와 DataFrame이라는 두 가지의 자료구조가 존재합니다. import pandas as pd list_item = [1, 2, 3, 4] # Pandas의 Series가 될 list 선언 se_item = pd.Series(list_item) # list를 이용하여 Series 생성 print(se_item) print(type..