언어
Javascript 정규식(Regex) 분석기
2018. 4. 3.최근 플러그인이나 툴을 만들때 사용자가 입력한 string을 일정 규칙에 따라 파싱할 일이 생겨서 정규식에 대해 좀 뒤적거려봤다. 정규식에 익숙하지 않다면 정규식을 활용한 소스코드를 읽고 이해하기는 힘들 겠지만, 정규식을 알고 있다면 작성해야하는 소스코드라인이 확 줄어버리기 때문에 대량의 문자열을 처리하는 웹이나 데이터 사이언스 분야에서는 필수가 아닐까 싶다. 하지만, 가독성만큼은 거의... 멸망에 가깝다고할 수 있다. 완벽하게 익혀서 술술 읽을 수 있는 것이 아니라면 대략 어떤 형태인지 주석이라고 달아두는 것이 유지 보수가 편할 것이라고 생각한다. 그러나 이번에 다른 오픈소스나 Gist를 좀 뒤적거리면서 느낀건.... 그렇게 주석을 써둔 사람이 없다는 거다. 그래서 (1)정규식이 아직 익숙하지 않고, ..
Windows pip에서 UnicodeDecodeError 해결하는 방법
2017. 2. 3.지금은 좀 지난 일이지만 페스트 캠퍼스라는 곳에서 '업무 자동화를 위한 Python'이라는 강의에 조교 알바로 일했던 적이 있다. 두 번 정도 했는데 강사님이 앞에서 수업하시는 동안 수강생분들이 손을 들면 찾아가서 버그를 고쳐주는 정도의 도움을 주는 역할이었다. 수강생분들이 조교를 부른 원인은 당연히 오타였고, 그다음으로는 논리적인 부분이나 라이브러리 활용법 정도였다. 세 개 전부 해결하기도 쉽고 오타를 제외한 다른 문제들은 해결해 드렸을 때 내 자신이 다시 공부하는 느낌도 있었기 때문에 보람이 있는 편이었다. 하지만 가장 짜증나는 에러가 있었는데 바로 'UnicodeDecodeError' 이제 Python2.x에서 Unicode만 들어도 짜증이 날것같다. 때는 Python2.x를 이용하여 크롤링 관련 ..