「POI2020 R1」Pisarze

ID: 3734

传统题

1000ms

256MiB

难度: 10

上传者:

标签>

字符串

概率论

启发式规则

对数似然计算

朴素贝叶斯

题目描述
题目译自 POI XXVII - I etap 「Pisarze」

给出一行波兰语文本，已知这段文本来自于以下三本书之一：

请你写一个程序判断这行文本来自于哪本书。

输入格式
输入数据第一行包含一个整数 $T$ ，表示测试数据组数。对于每组测试数据：

第一行包含一段波兰语文本，由 $10$ 到 $2000$ 个单词组成。这一行的开头或者结尾都是一个完整的单词或者标点符号。

保证输入的所有文本长度之和不超过 $2 \cdot 10^6$ 。

输出格式
对于每组数据，输出 Mickiewicz，Prus 或者 Sienkiewicz，表示这行文本所在书的作者。

样例
输入

3
Petroniusz obudzil sie zaledwie kolo...
Litwo! Ojczyzno moja! ty jestes jak...
W poczatkach roku 1878, kiedy swiat...

输出

Sienkiewicz
Mickiewicz
Prus

样例输入并不完整，被截断了一部分。

评分规则
这题的代码长度不能超过 $10$ KB。

这是一个数据分析题，你的程序不需要准确的识别每组数据。评分标准如下：

令 $T$ 是测试数据组数。
令 $P$ 是选手程序识别对的数据组数。

每个测试数据的文本来自于提供的文本，同时还附赠了一个脚本 pistestgen.py，可以从附加文件或者这里下载。用命令

python3 pistestgen.py subtask name directory [seed]

即可生成一组数据，其中：

所有的测试数据保证也是通过这个程序生成的。

数据范围

#L3233. 「POI2020 R1」Pisarze