se-simulator/markov.py

import markovify
from nltk.tokenize.moses import MosesDetokenizer, MosesTokenizer

tokenizer = MosesTokenizer()
detokenizer = MosesDetokenizer()


class MarkovText(markovify.Text):
    def word_split(self, sentence):
        return tokenizer.tokenize(sentence)

    def word_join(self, words):
        return detokenizer.detokenize(words, return_str=True)


class MarkovUserName(markovify.Text):
    def word_split(self, word):
        return list(word)

    def word_join(self, characters):
        return "".join(characters)
improve markov 2018-03-16 16:23:25 +01:00			`import markovify`
			`from nltk.tokenize.moses import MosesDetokenizer, MosesTokenizer`

			`tokenizer = MosesTokenizer()`
			`detokenizer = MosesDetokenizer()`


improve generator 2018-03-16 20:31:43 +01:00			`class MarkovText(markovify.Text):`
improve markov 2018-03-16 16:23:25 +01:00			`def word_split(self, sentence):`
			`return tokenizer.tokenize(sentence)`

			`def word_join(self, words):`
improve folder structure 2018-03-16 18:48:54 +01:00			`return detokenizer.detokenize(words, return_str=True)`
improve generator 2018-03-16 20:31:43 +01:00

			`class MarkovUserName(markovify.Text):`
			`def word_split(self, word):`
			`return list(word)`

			`def word_join(self, characters):`
			`return "".join(characters)`