목록데이터과학 (85)
스택큐힙리스트
다음을 수행한다면: import subprocessfrom cStringIO import StringIOsubprocess.Popen(['grep','f'],stdout=subprocess.PIPE,stdin=StringIO('one\ntwo\nthree\nfour\nfive\nsix\n')).communicate()[0]저는 이해합니다: Traceback (most recent call last): File , line 1, in ? File /build/toolchain/mac32/python-2.4.3/lib/python2.4/subprocess.py, line 533, in __init__ (p2cread, p2cwrite, File /build/toolchain/mac32/python-2.4.3..
나는 variable를 regex 안에 사용하고 싶은데, 어떻게 Python에서 할 수 있을까요? TEXTO = sys.argv[1]if re.search(r\b(?=\w)TEXTO\b(?!\w), subject, re.IGNORECASE): # Successful matchelse: # Match attempt failed답변 1정규식을 문자열로 빌드해야 합니다. TEXTO = sys.argv[1]my_regex = r\b(?=\w) + re.escape(TEXTO) + r\b(?!\w)if re.search(my_regex, subject, re.IGNORECASE): etc.re.escape를 사용하여 특수 문자가 있는 경우에도 해당 문자로 해석되지 않도록 주의하십시오.답변 2변수를 정규 표현식 안..
아래와 같이 .csv 파일에서 데이터를 Pandas 데이터프레임으로 읽었습니다. 하나의 열, 즉 id에 대해 열 유형을 int으로 지정하고 싶습니다. 문제는 id 시리즈에 누락/빈 값이 있습니다..csv를 읽으면서 id 열을 정수로 변환하려고 하면 다음과 같은 오류가 발생합니다: df= pd.read_csv(data.csv, dtype={'id': int}) error: Integer column has NA values대안으로, 나는 아래와 같이 읽은 후에 열 유형을 변환해 보았지만, 이번에는 다음과 같은 오류가 발생합니다. df= pd.read_csv(data.csv) df[['id']] = df[['id']].astype(int)error: Cannot convert NA to integer이것을 ..
저는 텍스트 파일의 내용을 순환하며 일부 줄을 검색 및 대체하고 결과를 파일에 다시 작성하고 싶습니다. 파일 전체를 먼저 메모리에 로드 한 다음 다시 작성할 수 있지만, 그것은 아마도 최선의 방법이 아닐 것입니다.다음 코드 내에서 이것을 가장 잘하는 방법은 무엇인가요? f = open(file)for line in f: if line.contains('foo'): newline = line.replace('foo', 'bar') # how to write this newline back to the file답변 1가장 짧은 방법은 아마 fileinput module을 사용하는 것일 것입니다. 예를 들어, 다음은 파일에 라인 번호를 추가하는 것입니다. import fileinputfor line in fi..