Modul:category tree/poscatboiler/data/wiktionary

Submodul data ini mentakrifkan sebahagian daripada struktur kategori Wikikamus.

Untuk pengenalan kepada sistem poscatboiler dan penerangan tentang cara menambah atau mengubah suai kategori, lihat Modul:category tree/poscatboiler/data/doc.


local raw_categories = {}
local raw_handlers = {}

local ceil = math.ceil
local concat = table.concat
local insert = table.insert
local log10 = math.log10

-----------------------------------------------------------------------------
--                                                                         --
--                              RAW CATEGORIES                             --
--                                                                         --
-----------------------------------------------------------------------------


raw_categories["Wiktionary"] = {
	description = "Kategori peringkat tinggi untuk bahan tentang Wiktionary dan pengendaliannya.",
	parents = {"Asas"},
}

raw_categories["Statistik Wikikamus"] = {
	description = "Categories and pages containing statistics about how Wiktionary is used.",
	parents = {"Wiktionary", sort = "Statistik"},
}

raw_categories["Pengguna Wikikamus"] = {
	description = "Halaman menyenaraikan Ahli Wikikamus mengikut hak pengguna dan kategori mereka menyenaraikan Ahli Wiktionarian mengikut keupayaan linguistik dan pengekodan mereka.",
	breadcrumb = "Pengguna",
	additional = "Untuk senarai semua pengguna yang dijana secara automatik, lihat [[Special:ListUsers]].",
	parents = {"Wiktionary", sort = "Pengguna"},
}

raw_categories["Bahasa pengguna"] = {
	description = "Kategori menyenaraikan ahli Wikikamus mengikut keupayaan linguistik mereka.",
	parents = {
		"Pengguna Wikikamus",
		"Kategori:Isu keberbilangan bahasa Wikikamus",
	},
}

raw_categories["Bahasa pengguna dengan kod tak sah"] = {
	description = "Categories listing Wiktionarians according to their linguistic abilities, where the language code is invalid for Wiktionary.",
	additional = "Most of these codes are valid ISO 639-3 codes but are invalid in Wiktionary for various reasons, " ..
	"typically due to different choices made regarding splitting and merging languages.",
	parents = {"Bahasa pengguna", sort = " "},
}

raw_categories["Tulisan pengguna"] = {
	description = "Kategori menyenaraikan ahli Wikikamus mengikut kebolehan mereka membaca tulisan yang diberikan.",
	parents = {
		"Pengguna Wikikamus",
		"Kategori:Isu keberbilangan bahasa Wikikamus",
	},
}

raw_categories["Pengekod pengguna"] = {
	description = "Categories listing Wiktionarians according to their coding abilities.",
	parents = {"Pengguna Wikikamus"},
}

raw_categories["Laman dengan entri"] = {
	description = "Laman yang mengandungi entri bahasa.",
	additional = "Subkategori dalam kategori ini digunakan untuk menentukan jumlah bilangan entri pada Wikikamus Bahasa Melayu.",
	parents = "Wiktionary",
	can_be_empty = true,
	hidden = true,
}

raw_categories["Redirects connected to a Wikidata item"] = {
	description = "Redirect pages which are connected to a [[d:|Wikidata]] item.",
	additional = "These are rarely needed, but are occasionally useful following a page merger, where other wikis may still separate the two.",
	parents = {"Statistik Wikikamus"},
	can_be_empty = true,
	hidden = true,
}

raw_categories["Tajuk tidak disokong"] = {
	description = "Halaman dengan tajuk yang tidak disokong oleh perisian MediaWiki.",
	additional = "Untuk penjelasan tentang sebab tajuk tertentu tidak disokong, lihat [[Lampiran:Tajuk tidak disokong]].",
	parents = "Wiktionary",
	can_be_empty = true,
	hidden = true,
}

-- Tracked according to [[phab:T347324]].
for ext, data in pairs {
	["DynamicPageList"] = {"DynamicPageList (Wikimedia)", "T287380"},
	["EasyTimeline"] = {"EasyTimeline", "T137291"},
	["Graph"] = {"Graph", "T334940"},
	["Kartographer"] = {"Kartographer"},
	["Phonos"] = {"Phonos"},
	["Score"] = {"Score"},
	["WikiHiero"] = {"WikiHiero", "T344534"},
} do
	local link, phab = unpack(data)
	raw_categories["Laman menggunakan sambungan " .. ext .. ""] = {
		description = ("Laman yang menggunakan sambungan [[mw:Extension:%s|%s]]."):format(link, ext),
		additional = phab and ("Lihat [[phab:%s|%s]] pada Phabricator berkenaan maklumat latar belakang mengapa sambungan ini dijejak."):format(phab, phab) or nil,
		breadcrumb = ("Menggunakan sambungan %s"):format(ext),
		parents = "Statistik Wikikamus",
		can_be_empty = true,
		hidden = true,
	}
end

-----------------------------------------------------------------------------
--                                                                         --
--                                RAW HANDLERS                             --
--                                                                         --
-----------------------------------------------------------------------------


local function get_level_params(data)
	local speak_verb = "cakap"
	if data.typ == "lang" then
		local is_sign_language = data.obj and data.obj:getFamilyCode():find("^sgn") or data.name:find("Bahasa Isyarat$")
		speak_verb = data.args.verb or is_sign_language and "bertutur dalam" or "cakap"
	end
	return {
		["-"] = {
			leftcolor = "#99B3FF",
			rightcolor = "#E0E8FF",
			lang = "Pengguna tersebut " .. speak_verb .. " NAME.",
			script = "Pengguna tersebut boleh baca NAME.",
			coder = "Pengguna tersebut tahu bagaimana menggunakan kod NAME.",
		},
		["0"] = {
			leftcolor = "#FFB3B3",
			rightcolor = "#FFE0E8",
			lang = "Pengguna tersebut tidak faham NAME (atau memahaminya dengan kesukaran ketara).",
			script = "Pengguna tersebut '''tidak boleh''' baca NAME.",
			coder = "Pengguna tersebut tahu '''sedikit''' tentang NAME dan hanya tiru penggunaan sedia ada.",
		},
		["1"] = {
			leftcolor = "#C0C8FF",
			rightcolor = "#F0F8FF",
			lang = "Pengguna tersebut " .. speak_verb .. " NAME pada tahap '''asas'''.",
			script = "Pengguna tersebut boleh membaca NAME pada tahap '''asas'''.",
			coder = "Pengguna tersebut tahu '''asas''' bagaimana menulis kod NAME kod dan buat pengubahsuaian kecil.",
		},
		["2"] = {
			leftcolor = "#77E0E8",
			rightcolor = "#D0F8FF",
			lang = "Pengguna tersebut " .. speak_verb .. " NAME pada tahap '''sederhana'''.",
			script = "Pengguna tersebut boleh membaca NAME pada tahap '''sederhana'''.",
			coder = "Pengguna tersebut menguasai NAME pada tahap '''sederhana''', dan boleh memahami beberapa skrip ditulis oleh orang lain.",
		},
		["3"] = {
			leftcolor = "#99B3FF",
			rightcolor = "#E0E8FF",
			lang = "Pengguna tersebut " .. speak_verb .. " NAME pada tahap '''lanjutan''' .",
			script = "Pengguna tersebut boleh membaca NAME pada tahap '''lanjutan''' .",
			coder = "Pengguna tersebut boleh menulis kod NAME yang '''lebih kompleks''', dan boleh memahami dan mengubah kebanyakan skrip yang ditulis oleh orang lain.",
		},
		["4"] = {
			leftcolor = "#CCCC00",
			rightcolor = "#FFFF99",
			lang = "Pengguna tersebut " .. speak_verb .. " NAME pada tahap '''hampir asli'''.",
			script = "Pengguna tersebut boleh baca NAME pada tahap '''hampir asli'''.",
			coder = "Pengguna tersebut boleh tulis dan faham akan kod NAME yang '''amat kompleks'''.",
		},
		["5"] = {
			leftcolor = "#FF5E5E",
			rightcolor = "#FF8080",
			lang = "Pengguna tersebut " .. speak_verb .. " NAME pada tahap '''profesional'''.",
			script = "Pengguna tersebut boleh baca NAME pada tahap '''profesional'''.",
			coder = "Pengguna tersebut boleh tulis dan faham akan NAME code pada tahap'''profesional'''.",
		},
		["N"] = {
			leftcolor = "#6EF7A7",
			rightcolor = "#C5FCDC",
			lang = "Pengguna tersebut merupakan penutur '''asli''' NAME.",
			script = "Tulisan '''asli''' pengguna tersebut ialah NAME.",
		},
	}
end


local coder_links = {
	Bash = "w:Bash (Unix shell)",
	C = "w:C (programming language)",
	["C++"] = "w:C++",
	["C Sharp"] = {link = "w:C Sharp", name = "C#"},
	CSS = "w:Lembaran Gaya Lata",
	Go = "w:Go (bahasa pengaturcaraan)",
	HTML = "w:HTML",
	Java = "w:Java (bahasa pengaturcaraan)",
	JavaScript = "w:JavaScript",
	Julia = "w:Julia (bahasa pengaturcaraan)",
	Lisp = "w:LISP",
	Lua = "Wiktionary:Pengekodan",
	Perl = "w:Perl",
	Python = "w:Python",
	Ruby = "w:Ruby",
	Scala = "w:Scala (bahasa pengaturcaraan)",
	Scheme = "w:Scheme (bahasa pengaturcaraan)",
	template = {link = "Wikikamus:Templat", name = "templat wiki"},
	VBScript = "w:VBScript",
}


-- Generic implementation of competency handler for (natural) languages, scripts, and "coders" (= programming languages).
local function competency_handler(data)
	local langtext = data.langtext
	local typ = data.typ
	local args = data.args
	local code = data.code
	local name = data.name
	local namecat = data.namecat
	local level = data.level
	local parents = data.parents
	local topright = data.topright
	local data_addl = data.additional

	local parts = {}
	local function ins(txt)
		insert(parts, txt)
	end
	local level_params = get_level_params(data)

	local params = level_params[level or "-"]
	if not params then
		error(("Ralat dalaman: Tiada param untuk kod '%s', aras %s"):format(code, level or "-"))
	end
	local function insert_text()
		if langtext then
			ins(langtext)
			ins("<hr />")
		end
		if not params[typ] then
			error(("Tiada teks bahasa Melayu untuk kod '%s', jenis '%s', aras %s"):format(code, typ, level or "-"))
		end
		ins(params[typ]:gsub("NAME", ("'''" .. namecat .. "'''"):format(name)))
	end

	local additional
	if level then
		additional = ("Untuk disertakan dalam senarai ini, tambah {{tl|Babel|%s}} pada laman pengguna anda. " ..
			"Panduan lengkap ada di [[Wikikamus:Babel]]."):format(level == "N" and code or ("%s-%s"):format(code, level)) ..
			(data_addl and "\n\n" .. data_addl or "")
	else
		additional = ("Untuk disertakan dalam senarai ini, gunakan {{tl|Babel}} pada laman pengguna anda. " ..
			"Panduan lengkap ada di [[Wikikamus:Babel]].") ..
			(data_addl and "\n\n" .. data_addl or "")
	end

	if level then
		ins(('<div style="float:left;border:solid %s 1px;margin:1px">'):format(params.leftcolor))
		ins(('<table cellspacing="0" style="width:238px;background:%s"><tr>'):format(params.rightcolor))
		ins(('<td style="width:45px;height:45px;background:%s;text-align:center;font-size:14pt">'):format(params.leftcolor))
		ins(("'''%s-%s'''</td>"):format(code, level))
		ins('<td style="font-size:8pt;padding:4pt;line-height:1.25em">')
		insert_text()
		ins('</td></tr></table></div><br clear="left">')

		return {
			description = concat(parts),
			additional = additional,
			breadcrumb = "Aras " .. level,
			parents = parents,
		}, not not args
	else
		ins(('<div style="float:left;border:solid %s 1px;margin:1px;">\n'):format(params.leftcolor))
		ins(('{| cellspacing="0" style="width:260px;background:%s;"\n'):format(params.rightcolor))
		ins(('| style="width:45px;height:45px;background:%s;text-align:center;font-size:14pt;" | '):format(params.leftcolor))
		ins(("'''%s'''\n"):format(code))
		ins('| style="font-size:8pt;padding:4pt;line-height:1.25em;text-align:center;" | ')
		insert_text()
		ins('\n|}</div><br clear="left">')

		return {
			topright = topright,
			description = concat(parts),
			additional = additional,
			breadcrumb = name,
			parents = parents,
		}, not not args
	end
end


insert(raw_handlers, function(data)
	local code, level = data.category:match("^Pengguna ([a-z][a-z][a-z]?)%-([0-5N])$")
	if not code then
		code, level = data.category:match("^Pengguna ([a-z][a-z][a-z]?%-[a-zA-Z-]+)%-([0-5N])$")
	end
	if not code then
		code = data.category:match("^Pengguna ([a-z][a-z][a-z]?)$")
	end
	if not code then
		code = data.category:match("^Pengguna ([a-z][a-z][a-z]?%-[a-zA-Z-]+)$")
	end
	if not code then
		return
	end
	
	local args = require("Module:parameters").process(data.args, {
		text = true,
		verb = true,
		langname = true,
		commonscat = true,
	})
	
	local lang = require("Modul:languages").getByCode(code, nil, "allow etym")
		local langname = args.langname
	
	if not lang then
		-- If unrecognized language and called from inside, we're handling the parents and breadcrumb for a
		-- higher-level category, so at least return something.
		if not level and data.called_from_inside then
			return {
				breadcrumb = {name = code, nocap = true}, -- FIXME, scrape langname= category?
				parents = {"Bahasa pengguna dengan kod tak sah", sort = code},
			}, true
		end
		
		if not langname then
			-- Check if the code matches a Wikimedia language (e.g. "ku" for Kurdish). If it does, treat
			-- its canonical name as though it had been given as langname=.
			local wm_lang = require("Module:wikimedia languages").getByCode(code)
			if not wm_lang then
				return
			end
			langname = wm_lang:getCanonicalName()
		end
	elseif not langname then
		langname = lang:getCanonicalName()
	end

	-- Insert text, appropriately script-tagged, unless already script-tagged (we check for '<span'), in which case we
	-- insert it directly. Also handle <<...>> in text and convert to bolded link to parent category.
	local function wrap(txt)
		if not txt then
			return
		end
		-- Substitute <<...>> (where ... is supposed to be the native rendering of the language) with a link to the
		-- top-level 'User CODE' category (e.g. [[:Category:User fr]] or [[:Category:User fr-CA]]) if we're in a
		-- sublevel category, or to the top-level language category (e.g. [[:Category:French language]] or
		-- [[:Category:Canadian English]]) if we're in a top-level 'User CODE' category.
		txt = txt:gsub("<<(.-)>>", function(inside)
			if level then
				return ("'''[[:Kategori:Pengguna %s|%s]]'''"):format(code, inside)
			elseif lang then
				return ("'''[[:Kategori:%s|%s]]'''"):format(lang:getCategoryName(), inside)
			else
				return ("'''%s'''"):format(inside)
			end
		end)
		if txt:find("<span") or not lang then
			return txt
		else
			return require("Modul:script utilities").tag_text(txt, lang)
		end
	end

	local function insert_request_cats(parents)
		if args.text or code == "ms" or code:find("^ms%-") then
			return
		end
		local num_pages = mw.site.stats.pagesInCategory(data.category, "pages")
		local count_cat, count_sort
		if num_pages == 0 then
			count_cat = "Permintaan untuk terjemahan dalam kategori kecekapan pengguna seramai 0 pengguna"
			count_sort = "*" .. code
		elseif num_pages == 1 then
			count_cat = "Permintaan untuk terjemahan dalam kategori kecekapan pengguna seramai 1 pengguna"
			count_sort = "*" .. code
		else
			local lowernum, uppernum
			lowernum = 2
			while true do
				uppernum = lowernum * 2 - 1
				if num_pages <= uppernum then
					break
				end
				lowernum = lowernum * 2
			end
			count_cat = ("Permintaan untuk terjemahan dalam kategori kecekapan pengguna seramai %s-%s pengguna"):format(
				lowernum, uppernum)
			count_sort = "*" .. ("%0" .. #(tostring(uppernum)) .. "d"):format(num_pages)
		end

		insert(parents, {
			name = "Permintaan untuk terjemahan dalam kategori kecekapan pengguna mengikut bahasa",
			sort = code,
		})
		insert(parents, {
			name = count_cat,
			sort = count_sort,
		})
	end

	local invalid_lang_warning
	if not lang then
		invalid_lang_warning = "'''AMARAN''': Kod bahasa yang dinyatakan tidak sah di Wikikamus. Tolong pindahkan semua " ..
			"penilaian kecekapan kepada kod sah terdekat."
	end

	local parents
	if level then
		parents = {("Pengguna %s"):format(code), sort = level}
	elseif lang then
		parents = {
			{name = "Bahasa pengguna", sort = code},
			{name = lang:getCategoryName(), sort = "pengguna"},
		}
		if lang:hasType("etymology-only") then
			insert(parents, {name = lang:getFull():getCategoryName(), sort = " " .. code})
		end
	else
		parents = {"Bahasa pengguna dengan kod tak sah", sort = code}
	end
	insert_request_cats(parents)

	local topright
	if args.commonscat then
		local commonscat = require("Modul:yesno")(args.commonscat, "+")
		if commonscat == "+" or commonscat == true then
			commonscat = data.category
		end
		if commonscat then
			topright = ("{{commonscat|%s}}"):format(commonscat)
		end
	end

	local namecat
	if level then
		namecat = ("[[:Kategori:Pengguna %s|%%s]]"):format(code)
	elseif lang then
		namecat = ("[[:Kategori:%s|%%s]]"):format(lang:getCategoryName())
	else
		namecat = "[[%s]]"
	end

	local additional
	if level then
		additional = ("Untuk disertakan dalam senarai ini, tambahkan {{tl|Babel|%s}} pada laman pengguna anda. " ..
			"Panduan lengkap wujud di [[Wikikamus:Babel]]."):format(level == "N" and code or ("%s-%s"):format(code, level)) ..
			(invalid_lang_warning and "\n\n" .. invalid_lang_warning or "")
	else
		additional = ("Untuk disertakan dalam senarai ini, gunakan {{tl|Babel}} pada laman pengguna anda. " ..
			"Panduan lengkap wujud di [[Wikikamus:Babel]].") ..
			(invalid_lang_warning and "\n\n" .. invalid_lang_warning or "")
	end
	return competency_handler {
		category = data.category,
		langtext = wrap(args.text),
		typ = "lang",
		args = args,
		obj = lang,
		code = code,
		name = langname,
		namecat = namecat,
		level = level,
		parents = parents,
		topright = topright,
		additional = invalid_lang_warning,
	}
end)


insert(raw_handlers, function(data)
	local code, level = data.category:match("^Pengguna ([A-Z][a-z][a-z][a-z][a-z]?)%-([0-5N])$")
	if not code then
		code = data.category:match("^Pengguna ([A-Z][a-z][a-z][a-z][a-z]?)$")
	end
	if not code then
		code, level = data.category:match("^Pengguna ([a-z][a-z][a-z]?%-[A-Z][a-z][a-z][a-z][a-z]?)%-([0-5N])$")
	end
	if not code then
		code = data.category:match("^Pengguna ([a-z][a-z][a-z]?%-[A-Z][a-z][a-z][a-z][a-z]?)$")
	end
	if not code then
		return
	end
	local sc = require("Modul:scripts").getByCode(code)
	if not sc then
		return
	end

	local parents
	if level then
		parents = {("Pengguna %s"):format(code), sort = level}
	else
		parents = {
			{name = "Tulisan pengguna", sort = code},
			{name = sc:getCategoryName(), sort = "pengguna"},
		}
	end

	local namecat
	-- Better to display 'Foo script' than just 'Foo', as so many scripts are the same as language names.
	if level then
		namecat = ("[[:Kategori:Pengguna %s|%s]]"):format(code, sc:getCategoryName())
	else
		namecat = ("[[:Kategori:%s|%s]]"):format(sc:getCategoryName(), sc:getCategoryName())
	end

	return competency_handler {
		category = data.category,
		typ = "script",
		obj = sc,
		code = code,
		name = sc:getCanonicalName(),
		namecat = namecat,
		level = level,
		parents = parents,
	}
end)


insert(raw_handlers, function(data)
	local code, level
	if not code then
		code, level = data.category:match("^Pengguna pengekod ([A-Za-z+-]+)%-([0-5N])$")
	end
	if not code then
		code = data.category:match("^Pengguna pengekod ([A-Za-z+-]+)$")
	end
	if not code or not coder_links[code] then
		return
	end

	local parents
	if level then
		parents = {("Pengguna pengekod %s"):format(code), sort = level}
	else
		parents = {"Pengekod pengguna", sort = code}
	end

	local langdata = coder_links[code]
	if type(langdata) == "string" then
		langdata = {link = langdata}
	end

	local namecat = ("[[%s|%%s]]"):format(langdata.link)

	return competency_handler {
		category = data.category,
		typ = "coder",
		code = code,
		name = langdata.name or code,
		namecat = namecat,
		level = level,
		parents = parents,
	}
end)

insert(raw_handlers, function(data)
	local n, suffix = data.category:match("^Laman dengan (%d+) entr(.+)$")
	-- Only match if there are no leading zeroes and the suffix is correct.
	if not (n and not n:match("^0%d") and suffix == (n == "1" and "i" or "i")) then
		return
	end
	return {
		breadcrumb = ("%d entr%s"):format(n, suffix),
		description = ("Laman yang mengandungi %s entr%s bahasa."):format(n, suffix),
		additional = "Kategori ini sebagaimana semua kategori lain digunakan untuk menentu jumlah bilangan entri pada Wikikamus Bahasa Melayu",
		hidden = true,
		can_be_empty = true,
		parents = {
			{name = "Laman dengan entri", sort = ("#%0" .. ceil(log10(require("Module:list of languages").count())) .. "d"):format(n)},
			n == "0" and "Penyelenggaraan Wikikamus" or nil, -- "Pages with 0 entries" only contains pages with something wrong.
		},
	}
end)

return {RAW_CATEGORIES = raw_categories, RAW_HANDLERS = raw_handlers}