본문 바로가기
728x90
반응형

전체 글63

파이썬 String 합치기, String concatenation, join 함수 (파이썬 클린 코드 #3) 전편 ☞ 2022.10.11 - [Data Engineering/파이썬] - 파이썬 클린 코드 #2: 딕셔너리 사용법 (get(), setdefault(), defaultdict()) 파이썬 String을 효율적으로 합치는 방법 파이썬에서 여러개의 String을 합칠 때는 보통 '+' 오퍼레이터를 사용한다. 이 방법은 String의 개수가 적을 때는 괜찮지만 아주 많은 수의(>1000) String을 합칠 때는 비효율적인 방법이다. 1. String을 합칠 때 '+'를 사용하는 게 비효율적인 이유 String은 immutable 객체이다. 따라서 우리가 '+' 오퍼레이터를 사용하면 기존의 String 값이 바뀌는 게 아니라 새로운 String 객체가 생성된다. 따라서 다음과 같은 코드는 루프를 돌면서 총.. 2022. 10. 12.
2022년 삼성전자 면접 준비 - 개발자 취준일기 29 전편 ☞ 2022.09.19 - [취준일기] - 2022년 KB국민카드 데이터개발 면접 후기 - 개발자 취준일기 22 지난 포스팅에는 삼성전자 면접 후기를 썼는데 이번에는 삼성전자 면접을 어떻게 준비했는지 좀 더 상세하게 쓰려고 한다. 내가 본 면접 중에 삼성전자랑 현재 회사 면접을 제일 열심히 준비했으니 이번 편을 본다면 면접 준비를 어떻게 해야할 지 대충 감이 올 거라 생각한다. 참고로 나는 삼성전자 메모리사업부에 지원했고 결과는 최합이었다. 지난 포스팅에서는 내가 지원한 직무가 소수직무라 밝히지 않겠다고 했지만 이미 새로운 공채가 진행 중인데 뭐... 내가 지원한 직무는 평가 및 분석이었다. 왜 평가 및 분석이었냐, 라고 한다면 아래 사진처럼 세부 직무 중에 데이터사이언스가 있었기 때문이다. 면접 .. 2022. 10. 11.
파이썬 올바른 딕셔너리 사용법: get, setdefault, defaultdict (파이썬 클린 코드 #2) 전편 ☞ 2022.10.07 - [Data Engineering/파이썬] - 파이썬 클린 코드 #1: enumerate, with, is, R-String, F-String 전편에 이은 파이썬 클린코드, 오늘은 딕셔너리 편이다. 파이썬 딕셔너리 사용 가이드 1. get()과 setdefault()를 쓰기 딕셔너리에서 키를 통해 밸류에 접근하는 법은 get()을 쓰는 법과 []를 쓰는 법 두가지가 있다. 하지만 []를 쓰면 해당하는 키다 없는 경우에는 KeyError가 뜨게된다. 하지만 get()을 쓰면 키가 없을 때 반환할 밸류를 설정할 수 있다. 아래 코드는 'cat'이라는 키가 딕셔너리에 없을 경우 0을 반환한다. # get(key, defulat value) numOfCat = numOfAnimal.. 2022. 10. 10.
스파크 NULL 처리 (스파크 정리 9) 전편 ☞ 2022.09.27 - [Data Engineering/스파크] - 스파크 정규표현식 (스파크 정리 8) 이번 실습을 진행하기 위해서 이전 포스팅(2022.09.16 - [Data Engineering/스파크] - 스파크란? 스파크 기본 개념 (스파크 정리 2))을 참고하여 데이터를 다운 받은 후 spark.read()를 이용하여 데이터프레임으로 데이터를 읽어오자. // in Scala val df = spark.read.format("json") .load("/data/flight-data/json/2015-summary.json") # in python df = spark.read.format("json").load("/data/flight-data/json/2015-summary.json".. 2022. 10. 8.
파이썬 enumerate, with, is, R-String, F-String (파이썬 클린 코드 #1) 파이썬 클린코드 (Pythonic Code) "Pythonic" 코딩이란 말 그래도 파이썬 답게 코딩을 한다는 것이다. 쉽게 말하면 파이썬 버전 클린코드라고 할 수 있다. 오늘 포스팅부터 이후 몇 포스팅에서는 어떻게 하면 "Pythonic"한 코드를 짤 수 있는지 가이드라인을 알려줄 것이다. 이번 포스팅에서 다룰 내용은 enumerate, with 구문, is 오퍼레이터, R-String, F-String이다. 1. range() 대신 enumerate()를 써라 다른 언어를 쓰다 온 사람이라면 배열에 있는 원소를 접근 할 때 정수 인덱스를 사용하는 것이 익숙할 것이다. 파이썬에서도 많은 사람들이 다음과 같은 코드를 짠다. arr = ['a', 'b', 'c'] for i in range(len(arr).. 2022. 10. 7.
환경변수란? 환경변수 설정(윈도우, 맥OS, 리눅스) 이번 포스팅에서는 환경변수에 대해 설명하고 윈도우, 맥OS, 리눅스에서 환경변수를 설정/수정하는 방법을 소개한다. 환경변수란? 환경변수는 OS에서 스트링을 저장하는 변수로 OS의 환경설정 (실행파일 위치, 홈 디렉토리, ...)과 관련한 정보를 담고있다. 필요에 따라 사용자가 환경변수를 추가하거나 기존의 환경변수를 수정할 수 있다. 대표적인 환경변수 PATH을 예시로 들면 환경변수에 대한 이해가 용이할 것 같아 PATH에 대해 설명하겠다. 환경변수 PATH 환경변수 중에 PATH는 실행파일의 경로들을 담고있는 환경변수이다. 우리가 커맨드라인에서 "python "와 같은 명령어를 칠 때 쉘은 PATH에 포함된 경로에서 python.exe라는 실행파일을 찾아서 실행하는 것이다. 윈도우의 명령프롬프트나 맥OS.. 2022. 10. 6.
728x90
반응형