본문 바로가기

지식13

서버에 파이썬 가상환경 만드는 두가지 방법_venv 와 conda 가상환경이 필요한 이유! 개인 컴퓨터에 가상환경 하는 이유는 보통 python 버전 문제와 패키지 충돌을 방지하기 목적으로 하는 경우가 많다. 파이썬을 이용하여 작업을 하다보면 사용하게 되는 툴에 따라 특정 버젼의 패키지가 필요한 경우가 많다. 예를 들어 A라는 프로젝트 할 때는 어떤 패키지의 1.0 version이 필요하고, B라는 프로젝트를 할 때는 2.0 version이 필요하다면 매번 작업할 때마다 패키지를 upgrade / downgrade 시켜야 되는 문제가 발생한다. 이러한 경우 각각의 프로젝트를 위한 가상환경을 만들어 두고 패키지를 따로 설치하여 작업하면 편리하다. 서버에서 작업을 하는 경우는 가상환경이 더욱 필요하다. 서버의 경우 공동으로 사용하는 환경에 새로운 패키지를 모든 사용자가 아.. 2021. 7. 20.
파이썬 (Python) 기초_리스트(list) 다루기, index사용, 유용한 함수 모음 리스트 정의하기! 리스트란 여러 개의 데이터를 순서대로 배열한 집합이다. 리스트는 모든 종류의 데이터를 포함할 수 있으며, 심지어 리스트 내에 리스트를 포함하게 할 수도 있다. 리스트에서 곱셈과 덧셈을 사용할 수 있다. 리스트의 길이를 확인하고 싶으면 len( )함수를 사용하면 된다. 리스트의 인덱스(index)로 데이터 다루기! 리스트 내의 각각의 데이터에는 순서가 있으며, 이를 인덱스(index) 라고 한다. 인덱스는 0부터 카운트한다. (1부터 아님) eg) 리스트 안의 데이터 개수가 5면 인덱스는 0~4가 된다. 인덱스를 이용하면 데이터를 편리하게 다룰 수 있다. 인덱스를 이용하여 리스트 내의 특정 데이터를 불러올 떄는 대괄호 [ ] 안에 인덱스 숫자를 입력하면 된다. [-1]을 입력하게 되면 인.. 2021. 6. 9.
R 프로그래밍 기초_데이터 분석을 위한 전처리 (tidyverse 패키지, 외부데이터 불러오기) 데이터 전처리란? 본격적으로 R을 이용하여 데이터를 다루기 위해 가장 먼저해야할 과정은 외부에서 Raw data를 가져와서 분석하기 좋은 형태로 데이터를 다듬는 일이다. Raw data의 형태는 워낙 다양하고 정돈되어 있지 않은 경우가 많다. 그래서 대부분의 분석가들은 데이터분석의 전체 과정에서 최소 반절 이상의 시간을 데이터를 분석하기 좋은 형태로 다듬는데에 사용하며 이러한 과정을 데이터 전처리라고 한다. 간단한 예로, 아래의 데이터시트는 병원에 방문한 환자에 대한 정보를 포함하는 데이터이다. 알러지의 유무(G열 Allergies)를 보면 yes, no를 대소문자를 혼용해서 사용하였다. 사람은 대소문자가 어떻게 되어있던 원하는 정보를 바로 판단할 수 있지만, 컴퓨터로 분석하기 위해서는 이러한 세세한 차.. 2021. 5. 31.
파이썬 (Python) 기초_스크립트 생성, 기본 문법 파일생성 및 저장! 먼저 Jupyter notebook을 실행시키고 새 script를 만들었으면 파일 이름을 생성해서 저장해 두자 (practice1.ipynb) 주피터 노트북으로 만든 파이썬 스크립트는 ipynb 확장자를 갖는다. 변수 생성! 변수란 어떤 값을저장하는 이름을 정하는 것이다. Python에서는 등호 기호( = )를 사용하여 변수 이름을 왼쪽, 값을 오른쪽에 입력하여 변수를 생성한다. 사용할 변수의 이름 = 변수에 저장할 값 (반대로 하면 안됨) 변수 이름에 띄어스기는 불가능하므로 언더바( _ )를 사용한다. 출력에는 print( )함수를 사용할 수 있다. 문자를 나타낼때는 큰따옴표("")나 작은따옴표('') 아무거나사용해도 된다 집합은 List로 묶을 수 있다. This_is_List라는.. 2021. 5. 28.