특정 문자열 없애기
Programming/Python 2013. 2. 13. 15:42 |열혈강의 파이썬 문제중...
텍스트에서 모든 태그를 제외한 정보를 출력하라. 태그란 < > 로 표현된 문자열을 의미한다.
이 문제가 있었는데... 해답이 없다. 인터넷을 돌아다니며 알아본 결과, 이것은 정규식을 가지고 해결하도록 유도하는 문제였다.. 아마.. 근데.. 정규식으로
이 문제의 대한 답인 정규식으로 url같은 긴 텍스트를 하니 잘 되지 않았다. 아마도 정규식에서 뭔가 빠진듯..
정규식을 안쓰고 했던 것.. 이것들은 안빠지고 잘 됨!
이 알고리즘보다는... 밑에 것이 낫다!! 이것은 반복문이 2개나 있기때문이다.
반복문 하나와 제어문으로 구성되어있다.
※ 정규식으로... 해 보았는데... 길고 복잡한 텍스트에서는 작동이 잘 안되었다. 정규식에 뭔가 빠진듯 하다.
import re
re.sub('<(.*?)>', '', ss)
이렇게 하였는데 url을 가져와서 해보니 잘 되질 않는다. 몇몇개가 빠진다.
'Programming > Python' 카테고리의 다른 글
파이썬에서 배열 표현 (1) | 2013.02.13 |
---|---|
명령행 옵션 처리 (0) | 2013.02.13 |
리스트 내장 (0) | 2013.02.13 |
Python의 리스트 자료형으로 Stack, Queue 쓰기 (0) | 2013.02.12 |
리스트 (0) | 2013.02.12 |