Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- JDK11 설치
- 웰씽킹 서평
- 맥북 개발자도구 단축키
- 웹투비제우스 연동
- 아비투스후기
- VUE js 에러
- Python
- Mac vue js 설치
- Java
- 자바
- json
- 맥북 사파리 개발자도구
- JAVA JDK 다운로드
- Vue js v-bind:key
- 파이썬 크롤링
- 웹투비 설정
- 맥북 vue.js 설치
- Mac 개발자도구
- 도리스 메르틴
- webtob 설치
- 서평
- 웹투비 제우스7
- 파이썬
- 아비투스서평
- Jeus Webtob
- 자바 툴 추천
- 쿵쿵나리
- 이선미
- 로컬 세팅
- 제우스 웹투비 세팅
Archives
- Today
- Total
개발일기 정답찾기
AWS Glue 개념정리, Crawler - 유딩동 Tistory 본문
안녕하세요, 유딩동입니다.
* AWS Glue 란?
AWS Glue는 분석, 기계 학습 및 애플리케이션 개발을 위해 데이터를 쉽게 탐색, 준비, 그리고 조합할 수 있도록 지원하는 서버리스 데이터 통합 서비스
* AWS Glue 특징
- 서버리스 (구성, 관리할 리소스 없음)
- 통합 데이터 카탈로그 제공
- crawler 통한 자동 스키마 검색 (별도로 Description을 짤 필요 없음)
- Scala, Python 코드를 통한 ETL 작업 생성 및 탄력적인 스케줄러 실행
* AWS Glue의 주요 구성 요소
- 데이터 카탈로그(중앙 메타데이터 레포지토리)
- ETL 엔진(Scala, Python)
- 스케줄러
* AWS Glue 크롤러
1. AWS Glue 크롤러는 데이터 스토어에 연결
2. 데이터 스키마 및 기타 통계를 추출한 후, 해당 메타데이터로 Glue 데이터 카탈로그를 생성
3. 신규 데이터의 가용성과 기존 데이터에 대한 변경 사항, 신규 테이블, 기 테이블에 새로운 파티션, 새로운 테이블 정의 버전을 자동으로 추가
'IT > cloud' 카테고리의 다른 글
Apache Spark 분산 처리 시스템 - 유딩동 Tistory (0) | 2021.12.06 |
---|---|
OLTP OLAP 차이 - Parquet, AWS에 사용에 앞서서.. - 유딩동 Tistory (0) | 2021.12.06 |
Comments