본문 바로가기
반응형

분류 전체보기164

[NLP] NLTK 형태소 분석기 POS(Part of Speech) tag 리스트 이번에 영문 텍스트 데이터를 다루면서 특정 형태소만을 추출해야하는 경우가 있었다. 명사는 NN으로 시작한다던지.. 복수면 NNS일거라 예상을 하고 nltk에서 제공하는 태그 리스트를 확인해보았다. 구글링을 해보면 많은 분들이 엑셀이라던지 표 형식으로 많이 정리해두었는데 정확한 태그셋 확인 방법이 있다. 태그 확인 방법 (당연 nltk 는 설치가 되어 있겠죠?) >>> import nltk >>> nltk.download('tagsets') 'punkt', 'averaged_perceptron_tagger'와 같이 'tagsets' 라이브러리를 다운받아야한다. 다운 후에 >>> import nltk >>> nltk.help.upenn_tagset() 명령어로 태그 목록을 확인할 수 있다. 총 45개의 태그.. 2021. 9. 7.
[카페] 김포 마산동 카페 맛집 - 애프터이미지(AfterImage) 김포 마산동에 신규 오픈한 카페에 다녀왔어요~~ 커피 한잔과 디저트에서 여운을 느낄 수 있는 카페 애프터 이미지를 소개합니다! 위치는 경기 김포시 마산동 675-1 이에요~ 근처에 공원이 많고 한적해요~ 카페 주변에 주차 공간도 많아요! 카페는 통유리이고 센스있게 카페 이름이 적혀있습니다~ 인테리어는 직접 하셨다고 하는데 아주 깔끔하네요옹~ 무엇보다 천장이 높아서 좋은 것 같아요 여기저기 식물이 많아서 눈이 즐겁습니당 ㅎㅎ 느낌있게 찍어봤다고 친구에게 자랑했는데 친구가 역시 사진에는 소질이 없는 것 같다고 하네요(ㅋㅋㅋ) 저는 아아, 바닐라빈라떼와 함께 당근케이크를 주문했습니다! 당근케이크 정말 맛있었어요~ 옆에 주문서도 함께주는데 너무 귀엽네요 ㅎㅎ 순식간에 다 먹고 친구네 부부가 온다고해서 기다렸다가.. 2021. 9. 4.
[프로그래머스] 가장 큰 수(level 2) 파이썬 문제 풀이 문제 링크: https://programmers.co.kr/learn/courses/30/lessons/42746 코딩테스트 연습 - 가장 큰 수 0 또는 양의 정수가 주어졌을 때, 정수를 이어 붙여 만들 수 있는 가장 큰 수를 알아내 주세요. 예를 들어, 주어진 정수가 [6, 10, 2]라면 [6102, 6210, 1062, 1026, 2610, 2106]를 만들 수 있고, 이중 가장 큰 programmers.co.kr 문제 해결 방법(시간 초과) 1. 먼저 리스트에 정수가 있으므로 문자형으로 바꾸어준다. 2. 모든 가능한 조합을 만든 후에 가장 큰 수를 출력한다. from itertools import permutations def solution(num): permute = list(permutat.. 2021. 8. 27.
[프로그래머스] 모의고사(level 1) 파이썬 문제 풀이 문제 링크: https://programmers.co.kr/learn/courses/30/lessons/42840 코딩테스트 연습 - 모의고사 수포자는 수학을 포기한 사람의 준말입니다. 수포자 삼인방은 모의고사에 수학 문제를 전부 찍으려 합니다. 수포자는 1번 문제부터 마지막 문제까지 다음과 같이 찍습니다. 1번 수포자가 찍는 programmers.co.kr 완전 탐색에 해당하는 문제이다. 무식해보여도 가끔은 최고의 방법이라는.. 문제 풀이 1. 수포자마다 패턴이 다르므로 패턴을 하드코딩으로 넣어준다. 2. 문제의 갯수마다 반복문을 돌면서 각 수포자가 맞춘 갯수를 세어준다. (문제의 갯수를 입력으로부터 알 수 있음) 3. 세 명의 수포자 중 가장 많이 맞춘 갯수를 찾는다. 4. 가장 많이 맞춘 수포자를 .. 2021. 8. 23.
[Pandas] 파일 read할 때 Error tokenizing data 에러 해결법 pandas에서 read_csv 해서 csv 파일을 읽을 때 아래와 같은 오류를 볼 수 있다. Error tokenizing data. C error: Expected ... 오류 내용을 보니 예상되는 필드는 12개여야하는데 9437라인에서 17개가 된다고 보인다. 오류 원인 - 쉼표로 분리될 때 각 라인마다 분리되는 개수가 달라서 발생하는 것이다. 해결하기 전에 분리될 때 개수가 정말 다른지 확인을 해보면 된다. from collections import Counter with open(file_path, encoding="utf-8") as f: lines = f.readlines() print(len(lines)) len_list=[] for _ in range(len(lines)): print(s.. 2021. 8. 20.
[HTML] 폼 필수 입력 메시지 변경 방법(form required message customizing) HTML form에서 input이나 select를 필수로 하게 해야할 때가 있다. 태그 내부에 required를 사용해주면 값이 입력이 되지 않으면 알림이 오게 된다. 다음은 HTML 소스와 해당 페이지 결과이다. The select required attribute The required attribute specifies that the user is required to select a value before submitting the form: Choose a car: None Volvo Saab Mercedes Audi 이 때 None으로 되어있는 옵션의 value는 ''로 비어있다. 이 때 select 콤보박스는 required 옵션이 있어서 값이 없는 경우에는 알림이 뜬다. 이 때 따로 메시.. 2021. 8. 19.
[Linux Command] ls를 이용한 디렉터리 하위 모든 파일 출력하기 리눅스에서 파일 목록을 출력해보기 위해 ls 명령어를 사용한다. ls 명령어에 옵션을 주고 목록을 다양한 형태로 확인할 수 있다. 디렉터리 하위 모든 파일을 출력하기 위해서는 -R 옵션을 사용해서 볼 수 있다. Recursive 하게 목록을 출력한다 ls -R 명령어로 현재 위치한 디렉터리에 있는 모든 폴더 및 파일을 확인할 수 있다. ls -R 2021. 8. 18.
[캐글 Kaggle] 캐글 에러 - Unable to find the required key value error 해결 방법 캐글에 파일을 제출하려고 하니 아래와 같이 unable to find the required key value ' ' in the column 이라는 에러가 발생했다. 에러 발생 원인 comment 컬럼에 큰따옴표가 3개가 들어가서 생긴 것이다. 컬럼 내부에 "안녕하세요" 가 있으면 괜찮지만 csv 파일로 만들면서 """안녕하세요""" 가 된 것이 문제였다. 해결방법 to_csv 할 때 quoting = 3 옵션을 주어서 해결할 수 있다. quoting=3은 큰따옴표를 무시하겠다는 옵션이다. result.to_csv(DATA_OUT_PATH, index = False, quoting = 3) 2021. 8. 17.
[Python] 리스트를 문자열로 변환하기(python list to string) 파이썬에 리스트를 문자열로 변환하여 출력을 해야 하는 경우가 있다. 예를 들면 ['apple', 'banana', 'melon'] 으로 된 리스트를 apple, banana, melon 으로 된 string 형태로 출력하고 싶다면 아래와 같이 하면 된다. list = ['apple', 'banana', 'melon'] list_to_string = ", ".join(list) print(list_to_string) >> apple, banana, melon 만약 apple-banana-melon 의 형식으로 출력을 하고 싶다면 아래와 같이 하면 된다. list = ['apple', 'banana', 'melon'] list_to_string = "-".join(list) print(list_to_stri.. 2021. 8. 14.
반응형