본문 바로가기

언어/Python

[ Python ] re.split() 사용하기

반응형

[python] re.split은 정규 표현식을 사용하여 문자열을 특정 패턴에 따라 분할하는 Python의 re 모듈에서 제공하는 함수입니다. 이 함수는 문자열을 정규 표현식의 패턴을 기준으로 분할하여 리스트로 반환합니다.

1. 사용법

import re

result = re.split(pattern, string, maxsplit=0, flags=0)
  • pattern: 분할할 기준이 되는 정규 표현식 패턴.
  • string: 분할할 대상 문자열.
  • maxsplit: 분할할 최대 횟수 (기본값은 0으로, 무제한으로 분할함).
  • flags: 정규 표현식에 대한 추가 옵션 (예: re.IGNORECASE 등).

2. 예제

예제 1: 공백을 기준으로 문자열 분할

import re

text = "Hello, how are you today?"
result = re.split(r'\s+', text)
print(result)

출력:

['Hello,', 'how', 'are', 'you', 'today?']

이 예제에서는 \s+ 패턴을 사용하여 하나 이상의 공백을 기준으로 문자열을 분할합니다.

예제 2: 쉼표와 공백을 기준으로 문자열 분할

import re

text = "apple, orange, banana, grape"
result = re.split(r',\s*', text)
print(result)

출력:

['apple', 'orange', 'banana', 'grape']

여기서는 ,\s* 패턴을 사용하여 쉼표 뒤에 오는 공백도 함께 분할 기준으로 삼았습니다.

예제 3: 여러 구분자를 사용한 문자열 분할

import re

text = "apple;orange,banana grape"
result = re.split(r'[;, ]+', text)
print(result)

출력:

['apple', 'orange', 'banana', 'grape']

이 예제에서는 [;, ]+ 패턴을 사용하여 세미콜론, 쉼표, 공백을 기준으로 문자열을 분할했습니다.

이와 같이 re.split은 다양한 정규 표현식을 사용하여 문자열을 원하는 방식으로 분할하는 데 유용합니다.

반응형