PY ] 판다스 자주 사용하는 코드 정리

Notice

Recent Posts

Recent Comments

Link

« 2025/03 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

Tags more

Archives

Today

Total

관리 메뉴

개발관련일지

PY ] 판다스 자주 사용하는 코드 정리 본문

개발기록/PYTHON

PY ] 판다스 자주 사용하는 코드 정리

BEECHANGBOT 2020. 7. 21. 13:31

train = pd.read_json('/path')

making_df = {'num' : [1,2,3,4,5,6,7,8]}
made_df = pd.DataFrame(making_df)

train_list = train[['col1','col2']].values.tolist() 
#컬럼 1 2 를 배열로 변환

train[['col1','col2','col3','col4']].to_csv('/content/drive/My Drive/',encoding='utf-8-sig')
#해당 컬럼들만 csv파일로 저장

for i in train.index: #트레인 인덱스로 포문돌림

count_list = list(pd.value_counts(count_list)[:100].index)
# 리스트에 [1 2 3 4 5 1 2 3 1 1 2] 이렇게있으면 중복되는 순으로 카운트해서 앞에서 100개만 짤라줌

train.col1 of train['col1']  #해당 컬럼 선택

train.loc[row1] #인트 스트링 상황에 맞게 사용
train.loc[:] #전체 불러오기

train['col6'] = train['col6'].map(lambda x: list(filter(lambda x: not(x[0]) in no_use_items, x)))
# 형태소분석기 쓸떄 사용한 코드인데 col6의 아이템중에 no_use_items이 포함되어있지 '않은것'만 사용
# 원랜 필터메소드가 있는거만 사용인데 앞에 not을 붙여서 반대로 사용하였음 

train["want_add_col"] = train["sample_dol"].map(lambda x : dic[str(x)])
#컬럼을 생성할때 df에 가지고있는 값을 이용하고 싶을떄 불러온후 map lambda x로 사용하도록한다 딕셔너리말고 포문으로도 가능함

train[['col1']].values # 해당컬럼 벨류로 반환 타입 확인하기
train[['col1']].values[0]# 0번쨰 로우에 있는 값 반환

for i in train.index:
    title = train.loc[i,"col1"]
    if "test" in title: 
#테스트란 스트링이 타이틀에 포함되어잇으면 이프문 실행   
 
df = pd.DataFrame.from_dict(using_dic, orient='index')
# using_dic을 이용해서 판다스로 변형함

df = df.sort_values(["item_count"], ascending=[False]) 
# item_count 오름차순으로 정렬

train[train["컬럼명"]=="찾고자하는단어"]

'개발기록 > PYTHON' 카테고리의 다른 글

PY ] 파이썬 포메팅 ( formatting ) (0)	2020.04.20

'개발기록/PYTHON' Related Articles

PY ] 파이썬 포메팅 ( formatting ) 2020.04.20

개발관련일지

PY ] 판다스 자주 사용하는 코드 정리 본문

PY ] 판다스 자주 사용하는 코드 정리

'개발기록 > PYTHON' 카테고리의 다른 글

티스토리툴바