'Data Science/Python' 카테고리의 글 목록 (4 Page)

Data Science/Python

[데이터 사이언스] (전처리) 특정 값이 있는 컬럼의 이름을 저장하는 코드

np.where에서 eq쓰는 방법이 idxmax 방법 보다 조금 빠른데, idxmax가 직관적이다. 그런데 idxmax는 숫자만 가능하기 때문에 문자를 찾아야 한다면 eq방법을 써야하겠다. import numpy as np import pandas as pd from time import time np.random.seed(1234) df=pd.DataFrame(columns=['a','b','c']) for i in range(0,1000): df.loc[i]=[0,0,0] random_col = np.random.choice([0, 1, 2]) df.iloc[i,random_col]=1 df=df.astype({'a':'int32','b':'int32','c':'int32'}) cols=df.colu..

Data Science/Python 2023. 12. 5. 23:04

[데이터 사이언스] 판다스 데이터프레임 색인 문법 비교

In [1]: import pandas as pd In [2]: df=pd.DataFrame(index=['a', 'b',0,1],columns=['a', 'b',0,1],data=[[1,2,3,4],[1,2,3,4],[1,2,3,4],[1,2,3,4]]) df Out[2]: a b 0 1 a 1 2 3 4 b 1 2 3 4 0 1 2 3 4 1 1 2 3 4 In [3]: %%javascript IPython.OutputArea.auto_scroll_threshold = 9999; In [4]: inputs="""'a' 'a':'b' 'a':0 0 0:1 [0,1]""".split('\n') index_commands=['[','.loc[','.loc[:,','.iloc[','.iloc[:,'] In ..

Data Science/Python 2023. 10. 12. 00:08

[데이터 사이언스] Numpy 속도가 빠른 이유와 속도 비교 예제

Numpy가 빠른 이유¶ for 루프를 사용한 리스트와 NumPy 배열에서 벡터화된 연산 간의 성능 차이는 몇 가지 주요 이유로 인해 발생합니다:¶ 1. Overhead: for 루프를 사용하면 반복문을 통해 각 요소에 접근하고 연산을 수행해야 합니다. 이는 반복문의 오버헤드와 Python 인터프리터의 각 반복에서 추가적인 작업이 필요하므로 느린 성능을 초래합니다.¶ 2. 메모리 관리: NumPy는 내부적으로 데이터를 연속된 메모리 블록에 저장하므로 데이터에 대한 메모리 액세스가 효율적입니다. 그에 반해 Python 리스트는 객체로 구성되어 있어 각 요소가 독립적인 객체로 메모리에 저장되므로 더 많은 메모리 관리 오버헤드가 발생합니다.¶ 3. 컴파일된 코드: NumPy는 C 언어로 작성된 내부 루프와 벡..

Data Science/Python 2023. 10. 11. 22:02

[데이터 사이언스] DataFrame 비교 함수 차이(isin, str.contains, str.match)

isin : 일치 해야함 str.contains, str.match : 정규식 없이 사용하면 부분만 일치하면 됨 str.contains, str.match : 정규식 사용하면 contains는 부분만 일치하면 되고, match는 전체가 일치해야함 값이 [20,200] 이고, 두자리 숫자를 찾는 경우라면 match에 정규식을 사용해야 함. contains로 처리하며 20, [20,0]이 찾아져서 둘 다 True가 됨. import pandas as pd df={'a':['1','10','20 HZz','30hz','300 ','300 hz',]} df=pd.DataFrame(df) print('contains과 match 차이') print('contains는 정규식이 포함되는 경우, match 정규식과 ..

Data Science/Python 2023. 9. 25. 18:27

플러터닷(Flutter.Dart)

고정 헤더 영역

메뉴 레이어

메뉴 리스트

검색 레이어

검색 영역

Data Science/Python

추가 정보

인기글

최신글

페이징

티스토리툴바