Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 웰씽킹 서평
- 서평
- 맥북 사파리 개발자도구
- Python
- 파이썬
- 맥북 개발자도구 단축키
- 웹투비제우스 연동
- 제우스 웹투비 세팅
- 쿵쿵나리
- 파이썬 크롤링
- webtob 설치
- 아비투스후기
- 웹투비 설정
- 도리스 메르틴
- JAVA JDK 다운로드
- VUE js 에러
- 이선미
- 로컬 세팅
- Mac vue js 설치
- 맥북 vue.js 설치
- Jeus Webtob
- json
- 자바 툴 추천
- Vue js v-bind:key
- Java
- 아비투스서평
- 자바
- 웹투비 제우스7
- Mac 개발자도구
- JDK11 설치
Archives
- Today
- Total
개발일기 정답찾기
AWS Glue 개념정리, Crawler - 유딩동 Tistory 본문
안녕하세요, 유딩동입니다.
* AWS Glue 란?
AWS Glue는 분석, 기계 학습 및 애플리케이션 개발을 위해 데이터를 쉽게 탐색, 준비, 그리고 조합할 수 있도록 지원하는 서버리스 데이터 통합 서비스
* AWS Glue 특징
- 서버리스 (구성, 관리할 리소스 없음)
- 통합 데이터 카탈로그 제공
- crawler 통한 자동 스키마 검색 (별도로 Description을 짤 필요 없음)
- Scala, Python 코드를 통한 ETL 작업 생성 및 탄력적인 스케줄러 실행
* AWS Glue의 주요 구성 요소
- 데이터 카탈로그(중앙 메타데이터 레포지토리)
- ETL 엔진(Scala, Python)
- 스케줄러
* AWS Glue 크롤러
1. AWS Glue 크롤러는 데이터 스토어에 연결
2. 데이터 스키마 및 기타 통계를 추출한 후, 해당 메타데이터로 Glue 데이터 카탈로그를 생성
3. 신규 데이터의 가용성과 기존 데이터에 대한 변경 사항, 신규 테이블, 기 테이블에 새로운 파티션, 새로운 테이블 정의 버전을 자동으로 추가
'IT > cloud' 카테고리의 다른 글
Apache Spark 분산 처리 시스템 - 유딩동 Tistory (0) | 2021.12.06 |
---|---|
OLTP OLAP 차이 - Parquet, AWS에 사용에 앞서서.. - 유딩동 Tistory (0) | 2021.12.06 |
Comments