반응형
Apache Airflow에서 DAG 파일을 등록하는 방법은 다음과 같습니다:
- DAG 파일 생성:
- DAG 파일은 Python 스크립트로 작성됩니다. 파일 확장자는
.py
이며, Airflow에서 인식할 수 있도록 DAG 객체를 정의해야 합니다. - 예시 코드:
- DAG 파일은 Python 스크립트로 작성됩니다. 파일 확장자는
from airflow import DAG
from airflow.operators.dummy_operator import DummyOperator
from datetime import datetime
default_args = {
'owner': 'airflow',
'start_date': datetime(2024, 10, 11),
'retries': 1,
}
dag = DAG(
'example_dag',
default_args=default_args,
schedule_interval='@daily',
catchup=False
)
start = DummyOperator(task_id='start', dag=dag)
end = DummyOperator(task_id='end', dag=dag)
start >> end
- DAG 파일 위치:
- 생성한 DAG 파일을 Airflow가 사용하는
dags_folder
에 위치시켜야 합니다. 기본적으로 Airflow는airflow.cfg
파일에서 설정된dags_folder
경로에 있는 모든.py
파일을 DAG로 인식합니다. airflow.cfg
에서dags_folder
의 기본 경로는~/airflow/dags
입니다.
- 생성한 DAG 파일을 Airflow가 사용하는
- Airflow Web UI에서 DAG 활성화:
- DAG 파일을
dags_folder
에 복사한 후 Airflow Web UI에 접속하여 새로 추가된 DAG을 확인할 수 있습니다. - Web UI에서 DAG을 활성화하려면 DAG의 토글 스위치를 켜야 합니다.
- DAG 파일을
- DAG 파일 자동 업데이트:
- Airflow는
dags_folder
를 주기적으로 스캔하여 새로운 DAG을 자동으로 등록합니다. 기본적으로 이 주기는min_file_process_interval
로 설정되며, 이는airflow.cfg
에서 조정할 수 있습니다.
- Airflow는
위의 절차를 따르면 Airflow에 새로운 DAG 파일을 등록하고 실행할 수 있습니다.
반응형
'Data Mining > Airflow' 카테고리의 다른 글
[ Airflow ] Celery, Ray - 비교 설명하기 (0) | 2024.11.16 |
---|---|
[ Airflow ] Airflow 설치하기 - Ubuntu (0) | 2024.10.15 |
[ Airflow ] 외부에서 대시보드 접속하기 (0) | 2024.10.11 |
[ Airflow ] Task Status 상태의 종류와 의미 (0) | 2024.10.01 |
[ Airflow ] Airflow 설치하기 (1) | 2024.09.30 |