본문 바로가기
Tech/Coding

백준20920🐨영단어 암기는 괴로워.py

by redcubes 2024. 2. 2.

문제

만들고자 하는 단어장의 단어 순서는 다음과 같은 우선순위를 차례로 적용하여 만들어진다.

  1. 자주 나오는 단어일수록 앞에 배치한다.
  2. 해당 단어의 길이가 길수록 앞에 배치한다.
  3. 알파벳 사전 순으로 앞에 있는 단어일수록 앞에 배치한다

+길이가 M이상인 단어들만 외운다고 한다.

입력

첫째 줄에는 영어 지문에 나오는 단어의 개수 N과 외울 단어의 길이 기준이 되는 M이 공백으로 구분되어 주어진다. $(1≤N≤100000, 1≤M≤10)$
둘째 줄부터 N+1번째 줄까지 외울 단어를 입력받는다. 이때의 입력은 알파벳 소문자로만 주어지며 단어의 길이는 10을 넘지 않는다.
단어장에 단어가 반드시 1개 이상 존재하는 입력만 주어진다.

출력

단어장에 들어 있는 단어를 단어장의 앞에 위치한 단어부터 한 줄에 한 단어씩 순서대로 출력한다.

예제 입력 1

예제 출력 1

예제 입력 2

예제 출력 2

7 4
apple
ant
sand
apple
append
sand
sand
sand
apple
append
12 5
appearance
append
attendance
swim
swift
swift
swift
mouse
wallet
mouse
ice
age
swift
mouse
appearance
attendance
append
wallet

빈도 세는 게 들어가서 좋아하는 collections 의 Counter를 썼다.
아이디어는 간단하다. 튜플로 만들어서 정렬하면 된다.
음수를 활용하면 람다까지 안 써도 할 수 있다.
(빈도×-1,길이×-1,단어) 를 리스트에 저장하고 정렬하면 끝.
튜플을 원소로 하는 리스트는 튜플의 앞쪽 원소부터 기준으로 삼고 정렬하기 때문이다.

from collections import Counter
from sys import stdin

raw = [line.rstrip() for line in stdin.readlines()]
n, m = map(int,raw[0].split())
words = [w for w in raw[1:] if len(w)>=m]
count = Counter(words)
paper = []
words = set(words)
for w in words:
    freq = count[w]
    leng = len(w)
    paper.append((-1*freq,-1*leng,w))
paper.sort()
result=list(zip(*paper))[2]
print("\n".join(result))