Skip to content

정규식 설계

정규식 설계에 도움이 되는 정보들입니다.

자연수 구간 매칭

숫자를 범위로 캡처하는 것은 꽤 복잡합니다. 아래 프로그램을 사용하세요.

구간을 입력해주세요.

공백 예외처리

LLM은 완벽하지 않다는 점을 유의해야 합니다.
Syntax 등을 사용해 출력 형식을 강하게 제어할 수 있어도, 결국 가끔씩 오류가 나는 것도 가능합니다.

이 중 가장 흔한 케이스인 공백을 잡아내 예외처리해볼 수 있습니다.

예를 들어, {{char::(캐릭터명)}} 꼴로 텍스트를 잡아내고자 아래와 같이 정규식을 설계했습니다.

md
\{\{char::(.*?)\}\}

그러나 실제 출력 중 일부에는 괄호와 텍스트 사이에 띄어쓰기가 나오는 경우도 생깁니다.

md
{{ char::코멧}}

이 경우는 정규식으로 잡지 못해 텍스트가 그대로 남게 됩니다.
이를 예방하기 위해, 띄어쓰기가 혹여나 들어갈 수 있는 자리에 공백 감지 문법 \s*를 넣어볼 수 있습니다.

md
\{\{\s*char::(.*?)\s*\}\}

이와 같이 설계하면 간혹 나오는 공백 오류도 깔끔하게 처리할 수 있습니다.