Wikcionário:Critérios de inclusão
Os critérios de inclusão são as regras que definem o que é permitido como entrada (verbete) no Wikcionário em português.
Eliminação |
---|
Arquivo de eliminadas |
Arquivo de não eliminadas |
Regra geral
[editar]Um termo deve ser incluído se é provável que alguém vá encontrá-lo em publicações diversas e possa querer saber o que ele significa. Isto, por sua vez, nos leva à regra um pouco mais formal segundo a qual um termo deve ser incluído se for atestado e se for idiomático.
A palavra "termo" deve ser interpretada de maneira ampla
[editar]Um termo não precisa ser limitado a uma única palavra. Qualquer um desses também são aceitáveis:
- Substantivos compostos e termos com várias palavras como posto de gasolina.
- Expressões idiomáticas tais como dar com os burros n'água e bom apetite.
- Provérbios
- Abreviaturas e siglas como FIFA.
- Prefixos e sufixos como re- e -ismo.
- Caracteres utilizados em escrita ideográfica ou fonética, como 字 ou ʃ.
Atestação
[editar]"Atestado" significa verificado através de:
- uso generalizado;
- uso em uma obra bem conhecida;
- aparição em uma revista acadêmica de prestígio;
- uso em mídia gravada permanente em pelo menos três instâncias independentes abrangendo pelo menos um ano e com transmissão de significado.
Sempre que possível, é melhor citar fontes que sejam suscetíveis de se manter facilmente acessíveis ao longo do tempo, para que alguém que pesquise o Wikcionário muitos anos no futuro possa encontrar a fonte original. Como o Wikcionário é um dicionário on-line, isto naturalmente favorece mídias tais como os grupos da Usenet, que são arquivados de maneira duradoura pelo Google. A mídia impressa tais como livros e revistas também servem, especialmente se seus conteúdos são indexados online. Outros suportes gravados, tais como áudio e vídeo também são aceitáveis, desde que sejam de origem verificável e sejam arquivados de maneira duradoura. Nós não citamos outros sítios da Fundação Wikimedia (como a Wikipédia), mas podemos usar citações encontradas neles (como citações de livros disponíveis no Wikisource). Ao usar uma citação de um livro, por favor inclua o código ISBN do mesmo.
Transmitindo significado
[editar]Isto elimina a aparição em listas brutas de palavras, comentários sobre a forma de uma palavra, como "A palavra 'blá' tem três letras", definições solitárias e exemplos artificiais de como uma palavra pode ser utilizada. Por exemplo, o fato de uma palavra aparecer em um dicionário on-line é sugestivo, mas não mostra a palavra realmente sendo utilizada para transmitir significado. Por outro lado, uma frase como "Para içar a vela, é só puxar a adriça (que é o cabo usado para levantar velas), tudo é muito prático e fácil...", aparecendo em uma narrativa sobre uma corrida de barcos, seria perfeitamente aceitável. Por acaso essa frase contém uma definição da palavra, mas essa palavra é usada também mostrando o seu significado.
Instâncias independentes
[editar]Isto serve para excluir múltiplas referências que apontam umas para as outras. Por exemplo, no caso de a Wikipédia possuir um artigo sobre um determinado assunto, e esse artigo ser "espelhado" por um site externo, a utilização de algumas palavras no site espelho não seria independente. É bastante comum descobrir que material de um site é facilmente rastreado em outros. Do mesmo modo, uma mesma citação, muitas vezes ocorre literalmente em fontes distintas. Embora as fontes possam ser independentes umas das outras, os usos em causa claramente não o são.
A suposição é de que se um termo só é usado em uma comunidade restrita, não há necessidade de se fazer referência a um dicionário geral como este nosso para encontrar o seu significado.
Abrangendo pelo menos um ano
[editar]Isto serve para filtrar as palavras que podem aparecer na língua, ter uso brevíssimo e depois nunca mais serem usadas. O limite de um ano é um tanto quanto arbitrário, mas parece funcionar bem na prática.
Termos de uso limitado
[editar]Termos de uso limitado, por exemplo, a apenas uma cidade ou bairro, cuja utilização é pouco abrangente ou não comprovada por quaisquer meios de comunicação, não preenchem os critérios de inclusão.
Idiomatismo
[editar]
Uma expressão é "idiomática" se o seu significado pleno não pode ser facilmente obtido a partir do significado dos seus componentes distintos. Caso contrário, a expressão é apenas resultado de "soma das partes" (SDP) que a compõem. Por exemplo, "isto é uma porta" não é idiomático, mas chega pra lá e casa da luz vermelha são.
Embora não sejam expressões, substantivos compostos são geralmente idiomáticos, mesmo quando o significado pode ser claramente expresso em termos de seus constituintes. A razão é que as partes muitas vezes têm vários sentidos possíveis, mas o composto é muitas vezes restrito a apenas algumas combinações dos mesmos. Por exemplo, o prefixo "mega-" pode denotar um milhão de alguma coisa ou simplesmente um grande exemplo de algo. Do mesmo modo, "estrela" pode significar um objeto celeste ou uma celebridade. Mas "megaestrela" significa "celebridade muito proeminente", não "um milhão de celebridades" nem "um milhão de objetos celestes". Um exemplo de expressão idiomática é "doença venérea", pois significa comumente "doença sexualmente transmissível", não uma "relacionada à deusa Vênus" ou "relacionada ao sexo" em geral (lembrar que disfunção erétil é uma doença sexual, mas não é transmissível), que são outros significados do termo "venéreo".
Esta regra deve ser aplicada com cuidado e é um tanto quanto subjetiva. Há casos em que uma expressão pode não ser idiomática, mesmo se seus componentes o são. Este critério é às vezes chamado de teste do ovo frito, pois um ovo frito geralmente significa um ovo (e geralmente um ovo de galinha ou similar) frito em uma determinada maneira. Essa expressão geralmente não denota um ovo mexido, que no entanto é cozido por fritura. No entanto, muitas expressões são idiomáticas como, por exemplo, "casa da luz vermelha". Estes testes são invocados apenas na discussão de casos obscuros. Exemplos tirados de livros de frases são expressões comuns que são consideradas úteis para falantes não nativos do idioma. Embora estes exemplos sejam incluídos como verbetes no dicionário, eles normalmente não são considerados idiomáticos. Por exemplo, "como se chama?" é claramente a soma de suas partes.
Adicionalmente, permite-se os aqui chamados verbete de interesse, ou seja, um termo que tem ao menos uma citação com definição em um dicionário fidedigno e pode levar a traduções que de outra forma não seriam acháveis ou ligáveis via Wikcionário.[nota 1]
Dúvidas quanto à nomenclatura das frases idiomáticas são esclarecidas em seção abaixo.
Erros de ortografia e variantes ortográficas
[editar]Não há uma regra simples e clara para determinar se uma determinada ortografia é "correta". Alguém que queira defender uma determinada ortografia em disputa deve estar preparado para apoiar a sua opinião com referências. Gramáticas e guias de estilo podem ser úteis nesse respeito, assim como estatísticas sobre a prevalência das diversas formas.
Os erros ortográficos mais simples são mais raros do que as grafias mais frequentes. Algumas palavras, no entanto, são frequentemente escritas incorretamente. Por exemplo, exceção é muitas vezes soletrado com dois esses, mas só a versão com cê-cedilha é considerada correta.
É importante lembrar que muitos idiomas não têm uma academia para estabelecer suas regras de uso e, portanto, podem ser propensos a grafias incertas. Esse problema é menos frequente, embora não totalmente desconhecido, em línguas como o português, em que a ortografia tem apoio jurídico documentado.
Variações regionais ou históricas não são erros de ortografia. Por exemplo, são bem conhecidas as diferenças existentes entre os países de língua portuguesa — e até mesmo entre regiões de um mesmo país —, tanto na grafia quanto no significado de muitas palavras. Uma grafia considerada incorreta em uma região pode não ocorrer em outra ou pode mesmo ser a grafia dominante em uma terceira. Da mesma forma, não são, em princípio, erros ortográficos os coloquialismos, as gírias, os tabuísmos, os termos da linguagem infantil, de internetês e outras entradas por contexto de uso, muitas das quais dicionarizadas e contando, portanto, com um padrão de ortografia.
A eventual incorporação de um termo não dicionarizado poderá ser feita, sempre mediante a aplicação das regras gerais de ortografia.
Uma vez comprovado que um erro ortográfico é frequente a ponto de merecer uma observação, esta pode ser inserida no próprio verbete da palavra correta, utilizando-se os cabeçalhos usuais de idioma e morfologia (substantivo, verbo, etc.), com a seguinte informação:
===Nota=== * A grafia "xyz" é considerada erro de ortografia.
É facultativo acrescentar uma explicação sobre o porquê de o termo ser um erro ortográfico.[nota 2]
Flexões
[editar]Os verbetes de formas flexionadas como câmeras, gansos e pediu devem indicar qual forma eles são e ter uma ligação para o verbete principal correspondente (câmera, ganso e pedir, respectivamente). Exceto no caso de verbetes compostos de múltiplas palavras, eles não devem apenas redirecionar.
Em verbetes de formas flexionadas com sentidos idiomáticos, como copas e irado, significados previsíveis devem ser separados dos idiomáticos.
Frases idiomáticas
[editar]Muitas frases podem assumir formas diversas. Não é necessário incluir todas as variantes. Quando presentes, variantes menores devem simplesmente redirecionar para a variante principal. Para o verbete principal, deve-se preferir a forma mais genérica, com base nos seguintes princípios:
Pronomes
[editar]Tanto quanto possível, evite utilizar pronomes da primeira e segunda pessoa nos títulos dos verbetes, prefira a terceira pessoa. Assim, cadastramos dar tudo de si e não dar tudo de mim e deitar-se com as galinhas ao invés de deitar-me com as galinhas. Porém, em alguns casos é necessário o emprego das formas da primeira e segunda pessoa, como em diga-me com quem andas e eu te direi quem és.
Artigos
[editar]Omita um artigo inicial, salvo se faz uma diferença no significado.
Verbos
[editar]Utilize a forma infinitiva do verbo para o verbo principal de uma frase verbal. Assim, para matou no peito, o verbete principal deve ser matar no peito. As variantes são obtidas pelas habituais regras da gramática.
Provérbios
[editar]O verbete de um provérbio começa com letra minúscula, quer se trate de uma frase completa ou não. No entanto, a primeira palavra ainda pode iniciar em maiúscula:
Idiomas a incluir
[editar]Línguas naturais
[editar]Todas as línguas naturais são aceitas. No entanto, é importante notar que a determinação de se um certo idioma é considerado uma língua viva, ou um dialeto ou um nome alternativo de uma outra língua é inerentemente subjetiva, em muitos casos, e pode ter uma forte conotação política.
Línguas de sinais
[editar]Verbetes de línguas de sinais são aceitáveis como entradas, e devem ser inscritos, tal como descrito na documentação específica a respeito.
Línguas artificiais
[editar]Línguas artificiais não se desenvolveram naturalmente, mas são o produto de um esforço consciente para atingir um determinado objetivo. Em geral, verbetes dessas línguas, em especial aquelas associadas a obras de ficção, não cumprem o requisito básico de que alguém poderia encontrá-los por acaso e querer saber seus significados, já que eles são usados apenas em um contexto mais restrito no qual há outros materiais sobre essa língua facilmente disponíveis para consulta. Há exceções a esta regra geral, listados abaixo, com base no consenso da comunidade do Wikcionário. O Esperanto, em particular, é uma língua viva com uma grande comunidade de falantes fluentes, e mesmo alguns nativos!
Alguns termos de línguas artificiais podem ter sido adotados em outras línguas. Estes devem ser tratados como termos da língua adotiva, e sua origem indicada na etimologia, não importando o fato de aquela língua como um todo ser considerada como válida para inclusão ou não.
- Estas línguas obtiveram o consenso de serem incluídas (todos têm códigos ISO 639-3): Esperanto, Ido, Interlíngua, Interlíngue (Ocidental), Língua Franca Nova, Lojban, Novial e Volapuque.
- Atualmente, outras 13 das 2600 línguas na lista ISO 639-3 são artificiais. A inclusão de palavras dessas línguas está sujeita a decisão da comunidade.
Mesmo quando uma determinada língua for rejeitada para inclusão no Wikcionário, um único artigo sobre o nome da língua pode ser aceitável.
Exclusões
[editar]Vandalismo
[editar]De tempos em tempos, contribuidores diversos inserem material no Wikcionário que obviamente não tem nada a ver com a finalidade do nosso projeto. Tal atividade é considerada vandalismo e será desfeita assim que possível. Se o vandalismo é uma edição de uma página já existente, essa edição será revertida. Se o vandalismo é a criação de um novo artigo, este artigo será removido. Isto é feito a critério dos administradores e não requer discussão, mesmo que o vandalismo seja um novo artigo para um termo que, de outro modo, satisfaz estes critérios, mas que ainda não entrou legitimamente.
Protologismos
[editar]A designação protologismo refere-se a termos definidos na esperança de que eles sejam utilizados no futuro, mas que não estão realmente em ampla utilização. Eles não devem receber entradas em separado; há uma página especialmente para listá-los: Wikcionário:Protodefinições
Universos ficcionais
[editar]Termos originários de universos ficcionais que tenham três citações em obras separadas, mas que não têm três citações independentes da referência a esse universo podem ser incluídos somente em apêndices de palavras referentes a esse universo, e não no espaço principal do projeto. No que diz respeito a nomes de pessoas ou lugares de universos ficcionais, eles não serão incluídos, exceto se forem utilizados fora de contexto em um sentido atributivo.
Para fins de definição de uma obra que seja composta de uma série de livros ou filmes ou episódios de televisão do mesmo autor que documentem as aventuras de um determinado conjunto de caracteres em um universo ficcional (por exemplo, os livros da série Harry Potter, os livros de Tolkien sobre a Terra Média, os filmes da série Guerra nas Estrelas), essa obra deve ser considerada como um trabalho único em várias partes.
O Wikcionário não é uma enciclopédia
[editar]Deve se tomar cuidado para que os verbetes do Wikcionário não se adquiram uma aparência enciclopédica; se isso acontecer, esse conteúdo deve ser transferido para a Wikipédia, mas o verbete do dicionário deve ser mantido.
Os artigos do Wikcionário devem ser sobre palavras, e não sobre pessoas ou lugares. Muitos lugares, e algumas pessoas, são conhecidos por uma única palavra, o que os qualificariam para a inclusão como se fossem nomes ou sobrenomes. Os artigos do Wikcionário são sobre as palavras. Artigos sobre locais e pessoas específicos devem ir para a Wikipédia. Por exemplo: o Wikcionário pode dar a etimologia, pronúncia, grafia alternativa, e significados epônimos de nomes como Santos, Londres, David, Sarney, e Madonna. Mas artigos sobre as cidades (Santos, Londres), a estátua (David de Michelangelo), o político (José Sarney) e a cantora pop (Madonna) são do âmbito da Wikipédia.
Nomes
[editar]Nomes podem ser de diversos tipos como nomes de empresa, nomes de produtos, nomes pessoais, sobrenomes e nomes completos de pessoas específicas, lugares e coisas. O Wikcionário classifica-os todos como nomes próprios, mas aplica ressalvas a cada um deles.
Termos genéricos são substantivos comuns e não próprios. Bauru, por exemplo, é utilizado como um termo genérico para um certo tipo de sanduíche. Uma boa regra para saber se um nome se tornou um termo genérico é ver se o termo pode ser utilizado sem capitalização.
Nomes de empresas
[editar]Só o fato de um termo ser um nome de empresa não garante sua inclusão. Para o termo ser incluído, tem que ser comprovada a utilização do nome da empresa de forma outra que como marca registrada (ou seja, uma utilização como uma palavra comum ou nome de família).
Nomes de produtos
[editar]Um nome de um produto físico deve ser incluído, se tiver entrado no léxico. Fora marcas registradas genéricas, isto é medido objetivamente pelo uso desse nome de produto em pelo menos três citações independentes arquivadas de maneira durável abrangendo um período de pelo menos três anos. As fontes dessas citações:
- devem ser independentes, no momento da autoria, de qualquer interesse econômico no produto (isso inclui os fabricantes, distribuidores, retalhistas, comerciantes e anunciantes, as matrizes, subsidiárias e filiais) e
- não deve identificar essas empresas
Se o termo tem proteção jurídica como uma marca, a fonte original não deve indicar tal situação. As fontes também não devem ser escritas:
- por qualquer pessoa ou grupo associado com o tipo de produto;
- sobre qualquer pessoa ou grupo especificamente associados com o produto, ou
- sobre o tipo de produto em geral.
O texto ao redor da citação não deve identificar o produto para o qual a marca se aplica, seja declarando expressa ou implicitamente alguma característica ou uso do produto a partir do qual o seu tipo e efeitos possam ser adivinhados, seja por alguma qualidade inerente que é necessária para uma compreensão da intenção do autor.
Nomes de lugares (topônimos)
[editar]De acordo com votação realizada, os topônimos não são aceitos sem restrição no Wikcionário. Podem ser catalogados livremente subdivisões administrativas hierarquicamente maiores que cidades (países, estados, etc.), bem como as próprias cidades e concelhos portugueses. Qualquer outro tipo de topônimo deverá passar por aprovação prévia antes de ser catalogado.
Nomes e sobrenomes de pessoas (antropônimos)
[editar]Nomes pessoais (como João, José e Maria) e sobrenomes (como Santos, Silva e Batista) são palavras como outras quaisquer e estão sujeitos aos mesmos critérios de inclusão como qualquer outra expressão. O Wikcionário tem artigos principais que apresentam etimologias, grafias alternativas, significados e traduções de nomes e sobrenomes.
Para a maioria dos nomes e sobrenomes é relativamente fácil demonstrar que a palavra preenche os critérios de inclusão, pois na maioria das vezes, os nomes e sobrenomes estão em uso generalizado em tanto na comunicação oral como na escrita. No entanto, só o fato de ser um nome por si só não qualifica automaticamente uma palavra para a inclusão. Um novo nome, que não foi comprovado, é ainda um protologismo. Um nome que ocorre apenas nas obras de ficção de um único autor, em uma série televisiva ou num jogo de vídeo, ou num contexto fechado como as obras que vários autores escrevem sobre um único universo ficcional não é utilizado de forma independente e não deve ser incluído.
Hipocorísticos, abreviaturas e siglas de nomes (como Zeca, por exemplo) seguem as mesmas normas como nomes.
A situação dos patronímicos não foi resolvida ainda.
O que o Wikcionário não é com relação aos nomes
[editar]O Wikcionário não é uma base de dados genealógica. Os artigos do Wikcionário sobre sobrenomes, por exemplo, não devem ser sobre as pessoas que compartilham um tal sobrenome. Eles são sobre o nome como uma palavra. Por exemplo: embora o verbete Pereira informará o leitor de que a palavra teve origem em Portugal (bem como dar as suas pronúncias e grafias alternativas), ele não deve servir para incluir informações sobre os ancestrais de pessoas que têm o nome da família Pereira.
Nomes de entidades específicas
[editar]Um nome deve ser incluído se for utilizado de maneira atributiva, com um significado amplamente compreendido. Uma pessoa ou lugar cujo nome não seja utilizado de maneira atributiva (e que não é uma palavra que deveria ser incluída por algum outro motivo) não devem ser incluídos. Assim, Vargas é um nome de família sancionado e que tem uma etimologia que se pode discutir Wikcionário e, por isso, deve ser incluído; já Getúlio Vargas (que não é utilizado atributivamente) não deve ser incluído.
Questões a considerar
[editar]Atestação e casos difíceis de decidir
[editar]De tempos em tempos surge a preocupação de que o fato de se adicionar uma entrada para um determinado termo possa levar à inclusão um grande número de termos semelhantes (por exemplo, quando o verbete Pokémon foi acrescentado ao projeto, um usuário começou a catalogar todas as centenas de nomes de pokémons). Isto não é um problema, uma vez que cada termo é considerado em separado baseado no seu uso, e não baseado no uso de termos semelhantes. Alguns exemplos:
- qualquer palavra de qualquer língua pode ser tomada emprestada pelo português, mas apenas algumas o são de fato. O fato de se incluir espaguete não implica que ricordati será a próxima palavra portuguesa a ser catalogada (embora naturalmente não haja problema algum como um termo italiano).
- qualquer palavra pode ser escrita no estilo internético, mas apenas umas poucas têm uso geral na língua do dia a dia.
- afixos gramaticais como meta- e -dade podem ser adicionados em muitos mais casos do que realmente são. Sufixos flexivos como -s para o plural de um substantivo e -ado/-ido para o passado de um verbo podem ser utilizados para praticamente qualquer substantivo ou verbo.
- pode parecer que prefixos internéticos da moda como e- são utilizados em toda parte, mas na verdade não o são tanto assim.
Variantes tipográficas
[editar]A inclusão de termos que contêm caracteres especiais ou que são por outra razão pouco usuais, tais como G-d, pr0n, i18n ou veg*n é algo controversa. Alguns veem alguns destes termos como bizarros ou não literários, não obstante o fato de eles aparecerem em uma variedade de meios de comunicação. Segundo estas pessoas, esses verbetes não devem ter lugar em um dicionário respeitável. Isto traz à tona a questão de saber o que constitui um dicionário respeitável e tende a excluir termos que as pessoas possam encontrar em textos diversos e querer saber seus significados.
Notas
[editar]- ↑ Critério dos "verbetes de interesse" aprovado em discussão mantida em Wikcionário:Esplanada/Arquivo/2016/Agosto#Lista de possíveis SdP's indicados pela Jéssica.
- ↑ Critério dos erros de ortografia e variantes ortográficas aprovado em discussão mantida em Wikcionário Discussão:Critérios de inclusão#Proposta de melhoria do item 1.4.