본문 바로가기
코딩 테스트&알고리즘/프로그래머스 level 3

[파이썬 python] 프로그래머스 - 불량 사용자

by 창현2 2021. 7. 28.
  • 불량 사용자

문제 설명

개발팀 내에서 이벤트 개발을 담당하고 있는 "무지"는 최근 진행된 카카오이모티콘 이벤트에 비정상적인 방법으로 당첨을 시도한 응모자들을 발견하였습니다. 이런 응모자들을 따로 모아 불량 사용자라는 이름으로 목록을 만들어서 당첨 처리 시 제외하도록 이벤트 당첨자 담당자인 "프로도" 에게 전달하려고 합니다. 이 때 개인정보 보호을 위해 사용자 아이디 중 일부 문자를 '*' 문자로 가려서 전달했습니다. 가리고자 하는 문자 하나에 '*' 문자 하나를 사용하였고 아이디 당 최소 하나 이상의 '*' 문자를 사용하였습니다.
"무지"와 "프로도"는 불량 사용자 목록에 매핑된 응모자 아이디를 제재 아이디 라고 부르기로 하였습니다.

예를 들어, 이벤트에 응모한 전체 사용자 아이디 목록이 다음과 같다면

응모자 아이디

frodo
fradi
crodo
abc123
frodoc

다음과 같이 불량 사용자 아이디 목록이 전달된 경우,

불량 사용자

fr*d*
abc1**

불량 사용자에 매핑되어 당첨에서 제외되어야 야 할 제재 아이디 목록은 다음과 같이 두 가지 경우가 있을 수 있습니다.

제재 아이디

frodo
abc123

제재 아이디

fradi
abc123

이벤트 응모자 아이디 목록이 담긴 배열 user_id와 불량 사용자 아이디 목록이 담긴 배열 banned_id가 매개변수로 주어질 때, 당첨에서 제외되어야 할 제재 아이디 목록은 몇가지 경우의 수가 가능한 지 return 하도록 solution 함수를 완성해주세요.

[제한사항]

  • user_id 배열의 크기는 1 이상 8 이하입니다.
  • user_id 배열 각 원소들의 값은 길이가 1 이상 8 이하인 문자열입니다.
    • 응모한 사용자 아이디들은 서로 중복되지 않습니다.
    • 응모한 사용자 아이디는 알파벳 소문자와 숫자로만으로 구성되어 있습니다.
  • banned_id 배열의 크기는 1 이상 user_id 배열의 크기 이하입니다.
  • banned_id 배열 각 원소들의 값은 길이가 1 이상 8 이하인 문자열입니다.
    • 불량 사용자 아이디는 알파벳 소문자와 숫자, 가리기 위한 문자 '*' 로만 이루어져 있습니다.
    • 불량 사용자 아이디는 '*' 문자를 하나 이상 포함하고 있습니다.
    • 불량 사용자 아이디 하나는 응모자 아이디 중 하나에 해당하고 같은 응모자 아이디가 중복해서 제재 아이디 목록에 들어가는 경우는 없습니다.
  • 제재 아이디 목록들을 구했을 때 아이디들이 나열된 순서와 관계없이 아이디 목록의 내용이 동일하다면 같은 것으로 처리하여 하나로 세면 됩니다.

[입출력 예]

user_idbanned_idresult

["frodo", "fradi", "crodo", "abc123", "frodoc"] ["fr*d*", "abc1**"] 2
["frodo", "fradi", "crodo", "abc123", "frodoc"] ["*rodo", "*rodo", "******"] 2
["frodo", "fradi", "crodo", "abc123", "frodoc"] ["fr*d*", "*rodo", "******", "******"] 3

입출력 예에 대한 설명입출력 예 #1

문제 설명과 같습니다.

입출력 예 #2

다음과 같이 두 가지 경우가 있습니다.

제재 아이디

frodo
crodo
abc123

제재 아이디

frodo
crodo
frodoc

입출력 예 #3

다음과 같이 세 가지 경우가 있습니다.

제재 아이디

frodo
crodo
abc123
frodoc

제재 아이디

fradi
crodo
abc123
frodoc

제재 아이디

fradi
frodo
abc123
frodoc

 


 

import collections
banned_dic = collections.defaultdict(list)
answer_list = []
answer_list_str = []

def dfs(banned_id, banned_id_idx, path):
    if banned_id_idx == len(banned_id):
        answer_list.append(list(path))
        return
    
    now_banned_id = banned_id[banned_id_idx]
    for i in range(len( banned_dic[ now_banned_id ] )):
    	# 지금 까지 더해준 후보군 path에 더할 때 중복이 생긴다면 안된다.
        if banned_dic[now_banned_id][i] in path:
            continue
        path.append( banned_dic[now_banned_id][i])
        dfs(banned_id, banned_id_idx+1, path)
        path.pop()
    
    return


def solution(user_id, banned_id):
    answer = 0
    # 일단은 길이 순으로 정렬 해보았음(큰 이유는 없슴)
    user_id.sort(key = len)
    banned_id.sort(key = len)
    
    # banned_id 에 맞는 user_id인지를 확인한다.
    for i, banned in enumerate(banned_id):
        for j, user in enumerate(user_id):
            if len(banned) != len(user):
                continue
            
            banned_user_possible = True
            for k in range(len(banned)):
                if banned[k] == "*":
                    continue
                elif banned[k] != user[k]:
                    banned_user_possible = False
                    break
            # banned_id 에 맞는 user_id라면 banned_딕셔너리에 해당 유저를 넣어준다. 
            if banned_user_possible == True:
            	# user_id 중복 제거. 이거 안하면 시간초과 났음.
                if user not in banned_dic[banned]: 
                    banned_dic[banned].append(user)
                    
    # banned_id 처음부터 DFS를 시작함.
    for i in range(len(banned_dic[banned_id[0]])):
        dfs(banned_id, 1, [ banned_dic[banned_id[0]][i] ] )

    # dfs로 만들어진 수많은 후보군 중에서 중복을 제거하기 위함. 문자열로 바꾸어 정렬 하면 같은 지 판별 가능.  
    for i in range(len(answer_list)):
        answer_list[i].sort()
        tmp_str = " ".join(answer_list[i])
        answer_list_str.append(tmp_str)
    
    
    #print(banned_dic)
    #print(len(collections.Counter(answer_list_str)))
    answer = len(collections.Counter(answer_list_str))
    return answer

 

테스트 1 〉	통과 (0.04ms, 10.3MB)
테스트 2 〉	통과 (0.09ms, 10.2MB)
테스트 3 〉	통과 (0.09ms, 10.3MB)
테스트 4 〉	통과 (0.08ms, 10.3MB)
테스트 5 〉	통과 (136.40ms, 20.8MB)
테스트 6 〉	통과 (1.59ms, 10.3MB)
테스트 7 〉	통과 (0.07ms, 10.3MB)
테스트 8 〉	통과 (0.10ms, 10.3MB)
테스트 9 〉	통과 (0.11ms, 10.3MB)
테스트 10 〉	통과 (0.07ms, 10.3MB)
테스트 11 〉	통과 (0.10ms, 10.2MB)

후기

 DFS 문제다. 코드가 뭔가 더럽다 더 깔끔하게 쓸 수 있었을텐데. 생각보다 구현하는 데에 시간이 오래 걸렸다. 생각보다 헷갈려서 print()로 계속 찍어서 시간이 더 오래 걸린.... 테스트 케이스1개가 시간초과가 나서 코드를 좀 수정했다. dfs를 사용할 때 중복되는 연산이 없도록 항상 주의하자.

 

풀이

* 딕셔너리를 사용하여 조건에 알맞는 id를 가져오고, 이것을 토대로 DFS를 사용해서 수많은 후보군들을 만들어 줍니다. 많은 후보군 중에서 중복을 없애줍니다. 

(1) banned_id 요소별로 알맞는 user_id를 가져온다. 딕셔너리 형태로 저장한다. 이 딕셔너리 요소 각각 마다 안에 존재하는 id는 중복되면 안된다(dfs 할 때 시간초과가 난다). 

ex) { "abc1**":["abc123"],  "******" : ["abc123" , "frodoc"] } -> 가능

ex) { "abc1**":["abc123"],  "******" : ["abc123" , "frodoc", "abc123" , "frodoc"] } -> 시간초과

(2) 이 딕셔너리를 토대로 DFS를 사용한다. DFS를 사용해서 많은 후보군을 만들어낸다. dfs에서 path라는 리스트에 id를 (현제 path 안의 요소와 중복되지 않으면) 계속 더해주며, 마지막에 끝까지 가면 answer_list에다 후보군인 path 리스트를 넣어준다.

(3) 후보군 중복 제거를 한다. 리스트를 정렬 시킨 후에, 리스트를 문자열로 변경 시키면 중복인지 아닌지를 판별 가능하다. 중복 제거를 한 후의 개수가 정답.

댓글