전체보기 153

SQL을 이용한 데이터 분석 DAY 3 GROUP BY와 CTAS

강의 GROUP BY & Aggregate "GROUP BY"는 테이블의 레코드를 그룹핑하는 함수 입니다. "Aggregate 함수"는 그룹핑한 필드에서 다양한 정보를 계산하는 함수들을 말합니다. 계산한 결과는 필드 이름(alias)를 지정하여 주는 것이 좋습니다. COUNT SUM AVG MIN MAX LISTAGG CTAS "CTAS"는 SELECT을 이용하여 테이블을 생성하는 방법 입니다. 기존의 테이블을 기반으로 데이터 분석에 기본이 되는 테이블을 사전에 생성할 수 있습니다. DROP TABLE IF EXISTS new_table; CREATE TABLE new_table AS SELECT A_table JOIN B_table ; 데이터 품질 확인 방법 중복된 레코드 체크하기 -- 전체 레코드 수..

SQL을 이용한 데이터 분석 Day 2 SELECT 배우기

강의 SQL SQL문 실행할 때 세미콜론으로 분리 필요 SQL 주석 : -- 혹은 /* -- */ 포맷팅 필요 → 대문자 사용 팀 프로젝트인 경우 공통 포맷 설정 필요 테이블/필드 명명규칙 필요 단수형 vs 복수형 _ vs CamelCasing "DDL"은 테이블의 구조를 정의하는 언어 입니다. CREATE TABLE : 테이블 생성 Primary key 속성 지정 CTAS(CREATE TABLE and then AS SELECT) : 생성 및 데이터 추가 DROP TABLE : 테이블 삭제 DROP TABLE IF EXISTS table_name; ALTER TABLE : 컬럼 추가/이름 변경/제거 및 테이블 이름 변경 ALTER TABLE table_name ADD COLUMN field_name f..

SQL을 이용한 데이터 분석 Day 1 SQL과 데이터베이스 소개

강의 데이터 관련 직군 데이터 엔지니어 SQL, 데이터베이스 ETL/ELT (Airflow, DBT) Spark, Hadoop 데이터 분석가 SQL, 비지니스 도메인에 대한 지식 통계 (AB 테스트 분석) 데이터 과학자 머신러닝 SQL, 파이썬 통계 데이터베이스 "관계형 데이터베이스"는 구조화된 데이터를 저장한 것입니다. 구조화된 데이터 저장 및 질의할 수 있도록 해주는 스토리지 엑셀 스프레드시트 형태의 테이블로 데이터 정의 및 저장 SQL, DDL(Data Definition Language), DML(Data Manipulation Language) 종류 프로덕션 데이터 베이스 MySQL, PostgreSQL, Oracle OLTP(OnLine Transaction Processing) 빠른 속도에 ..

크롤한 웹데이터로 만들어보는 웹사이트

1일차 처음해보는 프론트엔드 파트여서 일단 구조부터 만들어보고 있습니다! 주택 매매 가격 동향 지역 선택 {% if regions %} {% for region in regions %} {{region.dong_name}} {% endfor %} {% else %} no regions {% endif %} A시 A시 A시 A시 등락 지도 :root { --blue: #4e73df; --indigo: #6610f2; --purple: #6f42c1; --pink: #e83e8c; --red: #e74a3b; --orange: #fd7e14; --yellow: #f6c23e; --green: #1cc88a; --teal: #20c9a6; --cyan: #36b9cc; --white: #fff; --gray:..

Django REST Framework Part 2

User 추가하기 polls/models.py class Question(models.Model): question_text = models.CharField(max_length=200, verbose_name='질문') pub_date = models.DateTimeField(auto_now_add=True, verbose_name='생성일') owner = models.ForeignKey('auth.User', related_name='questions', on_delete=models.CASCADE, null=True) @admin.display(boolean=True, description='최근생성(하루기준)') def was_published_recently(self): return self...