일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- Aiffel
- 아이펠
- 파이썬 문법
- 파이썬 주석 변수
- 아이펠 일기
- PYTHON 주석 변수
- AIFFEL일기
- 파이썬
- 모듈 패키지 라이브러리
- Python
- 리눅스
- 마크다운 인라인 수식
- python 문법
- 마크다운 inline 수식
- 런타임
- 아이펠일기
- 파이썬 형변환
- AIFFEL 회고
- 파이썬 여러줄 문자열 변수
- 아이펠 회고
- AIFFEL 일기
- Markdown
- Linux
- 컴파일타임
- 파이썬 진수변환
- 파이썬 여러줄 주석
- 윈도우 커맨드창
- compile time
- 파이썬 긴 문자열 변수
- 마크다운
- Today
- Total
목록전체 글 (49)
튜토리얼에도 고난과 역경이 있다.
이상치 Outlier란? 대부분의 값의 범위에서 벗어나 극단적으로 크거나 작은 값. 즉, 노이즈 같은것! 이상치를 찾는 방법 1. z score 가장 많이 쓰는 방법으로 평균과 표준 편차를 이용한다. -> z score : 평균을 빼주고 표준 편차로 나누는 방법 μ : 평균 σ : 표준 편차 코드상의 구현 abs(df[col] - np.mean(df[col])) : 데이터 - 평균 의 절대값 abs(df[col] - np.mean(df[col]))/np.std(df[col]) : 표준편차로 나눠줌 df[abs(df[col] - np.mean(df[col]))/np.std(df[col])>z].index : 값이 z보다 큰 데이터 인덱스 추출 2. Modified Z-score method http://c..
todo format정리 여기는 자주쓰는 함수 input int 이런거만 남겨놓고 하이퍼링크하고 각각의 input/int페이지 작성하기 ctrl + f 해서 찾기! 이것 정돈 알아야 한다! input() 백준 알고리즘을 풀게되면 가장 많이 쓰게 될 함수. 사용자로부터 입력을 받온다. return형은 string인듯? print() int() int(매개변수) : return int형 매개변수 이거 알면 핵편함 enumerate() 리스트, 문자열, 튜플 등이 있는 경우 순서와 리스트의 값을 함께 반환해주는 메서드 map(function, iterable) 두 번째 인자로 들어온 반복 가능한 자료형 (리스트나 튜플)을 첫 번째 인자로 들어온 함수에 하나씩 집어넣어서 함수를 수행하는 함수입니다. 출처: ht..
join() 튜플, 리스트, stirng 등 반복 가능한 iterable 객체를 받는 메서드입니다. 각각의 원소를 모아 하나의 문자열로 합쳐줍니다. "요소 연결시 추가할 문자".join(iterable객체) #- join() alphabet = ['a', 'b', 'c'] ",".join(alphabet) 실행 결과 'a,b,c' split() #- split() >>> "hi this is me".split() ['hi', 'this', 'is', 'me'] >>> "this,is,me!".split(',') ['this', 'is', 'm..
int() int(매개변수) : return int형 매개변수 int(integer) -> Integer string to int int("string") -> Integer n진수 형변환 2/8/16진수를 10진수로 변환 int("number", base=10) -> 10진수를 Integer 변환 int("binary number 2진수 문자열", 2) -> 2진수를 Integer로 변환 int("octal number 8진수 문자열", 8) -> 8진수를 Integer로 변환 int("decimal number 10진수 문자열" , 10) -> 10진수를 Integer로 변환 int("hexadecimal 16진수 문자열", 16) -> 16진수를 Integer로 변환 int("ffff",16)의 실..
결측치 Missing Data란? 결측값은 입력이 누락된 값을 의미합니다. 즉, 누락된 값을 의미합니다. = 입력칸이 있는데 null인 값. 결측치 처리하는 방법 결측치 데이터를 제거 데이터가 너무 없어서 무쓸모일것 같다 -> 제거 결측치를 어떤 값으로 대체 데이터가 대부분 유효한 값이 있는데 한 두가지만 없다 -> 대체 결측치 데이터를 제거 drop 메소드를 이용. 결측치 데이터를 대체 수치형 데이터의 경우 대체 방법 4가지 특정 값으로 설정 결측치가 많은 경우, 모두 특정값으로 대체하면 분산이 작아지는 경우가 발생할 수 있음 평균 / 중앙 값으로 설정 결측치가 많은 경우, 분산이 작아지는 경우가 발생 가능 다른 데이터를 이용한 예측값으로 설정 Q. Gan을 이용하나? 시계열 데이터의 경우 앞 뒤 데이..
람다 표현식 lambda expression 이란? 람다란, 런타임에 생성해서 사용할 수 있는 익명 함수입니다. 자바에서 사용하는 익명함수와 비슷한 역할을 하는데, 람다 표현식은 사용법이 좀 더 간결합니다. 사용 예시 print( (lambda a, b : a * b)(5,6)) 실행 결과 : 30 즉, 사용방법은 다음과 같습니다. (lambda 사용할 변수 : 변수를 이용한 수식)(변수에 들어갈 값) map 함수 map(함수 f, iterable객체) iterable객체의 요소를 하나씩 함수 f에 넣어줌. 이때 f()가 아니라 f만 (함수 이름만!) 매개변수로 넣어줌. list(map(lambda a,b : a*b ,(5,6),(10,100))) 실행 결과 : [50, 600] print(map~)안 ..
List 란? 동적 배열(Dynamic Array)의 데이터 자료 구조 데이터들이 떨어진 위치에 저장되며 pointer로 연결된다. pointer : 해당 데이터의 다음 데이터 주소값을 가리키고 있다. 임의 접근 불가 순차 접근 / 시퀀셜 액세스 Sequential Access를 이용해야한다. Array 란? 연속(Sequence)형 데이터의 자료구조 데이터들이 연속된 메모리 영역에 순차적으로 저장 임의 접근 가능 : 인덱스 번호를 이용해서 빠르게 접근 List와 Array의 차이 시간 계산 Type Read Write/Update/Delete Array O(1) O(n) List O(n) O(1) 데이터를 읽을때는 arraylist가 빠르지만 데이터를 입력/삭제/수정할때는 리스트 자료형이 더 빠르다. ..
컴파일 타임 Compile time과 런타임 Run time은 소프트웨어 개발의 서로 다른 계층의 차이를 설명하기 위한 용어이다. 컴파일타임 Compile time 개발자가 작성한 소스 코드를 컴파일러가 컴파일이라는 과정을 통해 기계어 코드로 번역한다. 이러한 편집 과정을 컴파일타임이라고 한다. 런타임 Run time 컴파일 과정을 마친 프로그램이 사용자에게 실행 되며, 이 응용 프로그램이 동작되어 지는 때를 런타임이라고 한다. 컴파일 타임과 런타임 서로 다른 타입의 에러를 나타내기 위하여 사용되어지곤 한다. 컴파일 타임에 일어나는 에러 syntax error type error 런타임에 일어나는 에러 zero division error null point error 출처 https://spaghetti..