Как сокровище китайской классической литературы,《Мечта о красных особняках》Оно имеет чрезвычайно высокую литературную ценность и богатую тематическую окраску.(Нажмите «Прочитать исходный текст» в конце статьи, чтобы получить полные данные кода.)。
Похожие видео
В последние годы, с развитием технологий анализа больших данных и текста, стал возможен углубленный анализ классических литературных произведений, таких как «Сон о красных особняках». В этом исследовании язык R используется в качестве инструмента анализа для проведения анализа текста в полном тексте «Мечты о красных особняках». Ожидается, что с помощью статистики частоты слов, визуализации облака слов и сравнительного анализа «до и после» будет проведено глубокое исследование. эволюция темы и создание персонажей этого классического романа.
Поместите текст, который необходимо проанализировать, в Блокнот, сохраните его по соответствующему пути и откройте в R. Сюда я импортировал текст «Сна о красных особняках».
library(rJava)
library(Rwordseg)
words=unlist(lapply(X=lecre, FUN=seentCN))
#unlist Преобразование данных типа списка в вектор
#lapply() возвращает список той же длины, что и X. Каждый элемент является результатом, рассчитанным FUN, и соответствует каждому элементу в X.
v=rev(sort(v))
Отфильтровать результаты с одним словом и результаты с частотой слов менее 100.
d1=subset(d, nchar(as.chad$словарный запас))>1 & d$частота слов.Freq>=100)
wordcloud(d1$word
01
02
03
04
Сингефэньси («Баоюй»)
Судя по ключевым словам «девушка», «выйти» и «сестра», Цзя Баоюй — странный и вульгарный персонаж. С детства его очень любила бабушка Цзя Му, и он жил во дворе Цзя Му. Поэтому его избаловали и главной чертой, сформировавшей его характер, был бунт. Его поведение было «отстраненным и эксцентричным», и он был бунтовщиком в феодальном обществе. Он презирал славу и богатство и не желал делать официальную карьеру, заключающуюся в том, чтобы «учиться и становиться чиновником». Он ненавидел «восьминогие стереотипы» и оскорблял тех, кто учился и становился чиновниками, называя их «национальными ворами и трусами», и ленился связаться с ними и навестить их.
lecture<-read.csv("Мечта о красных особнякахвперед80раз.txt", sSE,header=FALSE)
words=unlist(lappl
#unlist Преобразование данных типа списка в вектор
#lapply() возвращает список той же длины, что и X. Каждый элемент является результатом, рассчитанным FUN, и соответствует каждому элементу в X.
word=lapply()
js
lecture<-read.csv("Мечта о красных особнякахназад40раз.txt", stder=FALSE)
qianword=qianword[which(qianword[ ,1] %in% gongtongword), ]
houword=houword[which(houword[ ,1] %in% gongtongword), ]
Бывшая мечта о красных особняках:
Пост-Сон о красных особняках:
t-тест использует теорию t-распределения для определения вероятности различий, тем самым сравнивая, является ли разница между двумя средними значениями значительной. Используется для сравнения разницы в частоте ключевых слов до и после Dream of Red Mansions.
t.test(qianword[,3],houword[,3])
Судя по результатам,Значение p t-теста значительно меньше 0,05.,Поэтому нулевая гипотеза отвергается. Существует 95%-ная уверенность в том, что «Мечта о красных особняках» до и после была сделана не одним человеком.