반응형
데이터 베이스 설치 후 airflow.cfg를 설정을 해야 합니다.
그 후 db init를 통해서 데이터 베이스를 사용해야 합니다.
1. airflow.cfg
생성 시점
airflow.cfg
파일은 Airflow를 처음 설치한 뒤 airflow
CLI를 실행하면 생성됩니다. 즉, airflow db init
명령을 실행하기 전에 CLI를 한 번 실행하면 기본 설정 파일이 생성됩니다.
예를 들어:
airflow version
airflow info
위 명령을 실행하면 Airflow 설치 디렉토리에 airflow.cfg
파일이 자동으로 생성됩니다.
2. PostgreSQL 설정 선행 가능 여부
airflow db init
이전에 PostgreSQL과 같은 외부 데이터베이스 설정을 할 수 있습니다. 이를 위해 airflow.cfg
를 수동으로 수정하거나 환경 변수를 사용하여 데이터베이스 연결 정보를 미리 정의할 수 있습니다.
방법 1: airflow.cfg
파일 직접 수정
- 위에서 설명한 방식으로
airflow.cfg
를 생성합니다. - 생성된 파일에서 아래 항목을 수정합니다:
[database]
sql_alchemy_conn = postgresql+psycopg2://username:password@hostname:port/dbname
방법 2: 환경 변수로 설정
Airflow는 환경 변수로도 설정을 오버라이드할 수 있습니다. 예를 들어:
export AIRFLOW__DATABASE__SQL_ALCHEMY_CONN='postgresql+psycopg2://username:password@hostname:port/dbname'
이렇게 하면 airflow db init
명령을 실행하기 전에 PostgreSQL 데이터베이스 연결을 설정할 수 있습니다.
3. PostgreSQL 설정 후 db init
db init
명령은 지정된 데이터베이스에서 Airflow의 메타데이터 테이블을 생성하는 역할을 합니다. 따라서 sql_alchemy_conn
을 PostgreSQL로 설정한 이후에 airflow db init
을 실행하면 해당 데이터베이스에 테이블이 생성됩니다.
결론
airflow.cfg
는db init
이전에도 생성 가능하며, PostgreSQL 설정을 미리 완료할 수 있습니다.- 환경 변수를 활용하면
airflow.cfg
파일을 생성하지 않고도 설정을 진행할 수 있습니다.
필요한 추가 정보나 궁금한 점이 있으면 말씀해주세요! 😊
반응형
'Data Mining & Distributed > Airflow' 카테고리의 다른 글
[ Airflow ] MySQL, PostgreSQL - 기본 Database 설정하고 생성하기 (0) | 2024.12.02 |
---|---|
[ Airflow ] operator - 여러 개의 operator를 생성해서 병렬 처리 확인하는 Dag 등록하기 (1) | 2024.12.02 |
[ Airflow ] schedule - 일정 주기로 dag 실행하기 (0) | 2024.12.02 |
[ Airflow ] schedule - 스케쥴러 시간 설정하기 (0) | 2024.12.02 |
[ Airflow ] Celery, Dask, Kubernetes, Ray - Executor 비교 설명하기 (0) | 2024.11.18 |