Temática 3: Técnicas de Recolha e Análise da Informação
Dados quantitativos – técnicas de análise
Equipa Amostra Equilibrada - Fernanda Ledesma, Ida Brandão, Rui Costa, Vitor Reis
Índice
Introdução
1. Objeto de estudo
2. Tipo de amostra
2.1. População alvo
2.2. Determinação da amostra
2.2.1. Dimensão da amostra
2.2.2. Método de amostragem
2.2.3. Ponderação da amostra
2.2.4. Margens de erro
3. Análise Quantitativa Utilizada
3.1. Variáveis e indicadores
3.2. Consumo de Substâncias Psicoativas - análise de gráficos e tabelas
3.3. Variável Única
3.3.1. Distribuição
3.3.2. Medidas de Localização
3.3.3. Medidas de Dispersão
4. Indicação de Testes Estatísticos Adicionais
Referências Bibliográficas
Introdução
Este é o trabalho de grupo da equipa Amostra Equilibrada que irá analisar o II Inquérito Nacional ao Consumo de Substâncias Psicoactivas na População Geral - Portugal 2007, estudo desenvolvido pelo Instituto da Droga e Toxicodependência, o qual foi selecionado como exemplo apresentado no anterior trabalho de inquérito por questionário e cuja análise irá agora ser aprofundada. Trata-se dum estudo extenso, com cerca de 300 páginas, e com uma volumosa descrição de dados. O IDT apresenta uma síntese deste estudo numa apresentação disponível no seu website.
O trabalho da equipa Amostra Equilibrada está disponível em http://analise1quantitativa1dados.pbworks.com, por ser uma ferramenta mais flexível e permitir incorporar código html/java..
Como introdução ao mundo das estatísticas e como estas podem ser apresentadas de forma criativa e motivante, recordamos um vídeo do médico sueco Hans Rosling que desenvolveu uma ferramenta de animação de estatísticas e que nos conta a história do desenvolvimento da saúde, a nível mundial desta forma fascinante:
1. Objeto de estudo
O consumo e tráfico de drogas em Portugal têm vindo a apresentar, ao longo dos últimos anos, mutações mais ou menos percetíveis. Ressaltam de entre estas a alteração do perfil dos consumidores e dos padrões de consumo, a diversidade de oferta de substâncias e, inclusivamente, a própria perceção social do fenómeno. O objetivo principal do inquérito em estudo, é estimar a prevalência do uso de substâncias psicoativas ilícitas entre a população Portuguesa, tratando-se de um estudo na "população geral", privilegiando os indicadores que o OEDT (Observatório Europeu da Droga e da Toxicodependência) propõe com o fim de promover uma comparação internacional. A apresentação dos resultados é feita de forma a permitir uma comparação com os dados que foram obtidos no inquérito anterior, em 2001, com 2007.
As prevalências do consumo de substâncias ilícitas registadas em Portugal são ainda comparadas com as prevalências que se verificam noutros países, nomeadamente europeus, sempre que se disponha de estatísticas comparáveis. Com base nesta comparação, observou-se, como já era em 2001, que os níveis de consumo em Portugal encontram-se, para quase todas as substâncias, entre os mais baixos da Europa. Exceção vai para a heroína, substância para a qual o nível de prevalência em Portugal é dos mais altos registados entre os países europeus.
Consumir drogas é uma prática humana, milenar e universal. Não existe sociedade que não tenha recorrido ao seu uso, em todos os tempos, com finalidades as mais diversas. A partir dos anos 60, o consumo de drogas transformou-se numa preocupação mundial, particularmente nos países industrializados, em função da sua alta frequência e dos riscos que pode acarretar à saúde. As primeiras experiências com drogas ocorrem frequentemente na adolescência. Nessa fase, o indivíduo é particularmente vulnerável do ponto de vista psicológico e social com motivações que conduzem ao consumo de substâncias ilícitas associadas, em boa parte, às culturas de lazer. Assim, é de particular importância estudar a população de forma minuciosa, principalmente no que se refere ao uso frequente e pesado de drogas lícitas e ilícitas, e identificar fatores psicológicos e socioculturais associados a tal uso.
Em Portugal uma entidade de referência é o IDT ( Instituto da Droga e da Toxicodependência), http://www.idt.pt/PT/Paginas/HomePage.aspx. O IDT desenvolve uma estratégia de combate à droga e à toxicodependência com base na prevenção dos consumos, tratamento e redução de riscos e minimização de danos e reinserção social, assegurando de uma forma transversal o funcionamento do sistema nacional de informação sobre droga e toxicodependência.
2. Tipo de Amostra
2.1. População alvo
A população alvo foi definida como sendo a população nacional residente no continente e nas ilhas, com idades compreendidas entre os 15 e os 64 anos de idade (em ambos os casos, inclusive). A definição destes limites respeita as orientações do OEDT (Observatório Europeu da Droga e Toxicodependência) que visam a produção de dados comparáveis no plano internacional.
2.2. Determinação da amostra
2.2.1. Dimensão da amostra
Tendo em conta os objectivos definidos para o estudo, a fixação das margens de erro e a relação custo/benefícios, a amostra teórica foi fixada nos 15.000 indivíduos, o que corresponde a uma taxa de sondagem de 1 para 474 indivíduos. Das 15.000 entrevistas inicialmente previstas foram realizadas apenas 12.202 entrevistas, facto que não invalida o desenho amostral elaborado. Os cálculos para determinar a dimensão da amostra foram feitos para um nível de confiança máximo de 95,5%.
2.2.2. Método de amostragem
O método utilizado para selecionar a amostra é designado por amostragem multi-etápica ou polietápica.
Foi concebido um desenho amostral particular e baseado na metodologia utilizado no estudo similar realizado em Espanha. O desenho amostral caracteriza-se por prever um sistema de tiragem polietápico, estratificado por conglomerados, com seleção das unidades primárias (concelhos) e das unidades secundárias (secções). A selecção das unidades de observação finais (indivíduos) realizou-se por sorteio sistemático na eleição dos lares e com recurso a tabelas de números aleatórios.
A amostra utilizada neste inquérito é, quanto ao método de extração, uma amostra aleatória realizada em duas fases:
Na primeira fase as entrevistas foram distribuídas pelos concelhos, de forma proporcional ao peso da população. Dentro dos concelhos foram sorteadas, também de forma aleatória proporcional, um conjunto de 1500 unidades estatísticas designadas secções (parcelas em que se dividem as freguesias);
Na segunda fase coube aos entrevistadores selecionar em cada uma das secções, de acordo com a metodologia previamente definida, o lar e os indivíduos a quem seriam feitas as entrevistas.
Metodologia:
1. Seleção das unidades primárias (concelhos)
Atendendo à metodologia escolhida havia que proceder à distribuição espacial do total de entrevistas a realizar. Partindo da divisão estatística da NUTS II, foram definidas 7 amostras regionais, para as quais se procurou assegurar a representatividade estatística. Incialmente foram distribuidas 600 entrevistas por cada um das regiões e posteriormente foram afetas as restantes entrevistas de modo proporcional à dimensão da população de cada região. A opção de não seguir a regra da proporcionalidade simples é justificada com a pretensão de obter nas regiões menos populosas um número de entrevistas que permita a segmentação mínima da sua população, nunca obtendo por região um número de entrevistas inferior a 800, de acordo com o Quadro 1.
De seguida foi necessário distribuir as entrevistas pelo território de cada região, de acordo com as sub-regiões estatísticas (NUTS II), de forma proporcional ao peso populacional de cada sub-região, de acordo com o Quadro 2.
Para determinar o número de entrevistas por concelho procedeu-se à estratificação tendo em conta o número de habitantes. Foram utilizadas duas classificações distintas, dado que a utilização de uma única classificação para as áreas metropolitanas de Lisboa e Porto e para os restantes concelhos do país revelar-se-ia inadequada, dada a disparidade da dimensão populacional. Assim, para as áreas metropolitanas de Lisboa e Porto utilizou-se uma estratificação por concelhos com 9 estratos, enquanto que para os restantes concelhos do país foi utilizada uma estratificação com apenas 5 estratos, de acordo com os Quadros 3 e 4.
Seguidamente procedeu-se à repartição dos concelhos de cada uma das regiões pelos respetivos estratos, tendo como critério a dimensão populacional. Para tal foram construídos quadros (Quadro 5) que expressam o resultado da distribuição dos totais das populações dos concelhos de cada região pelos estratos existentes.
Atendendo ao somatório do conjunto das populações dos respetivos concelhos, procedeu-se à distribuição proporcional das entrevistas atribuídas a cada sub-região por cada um dos estratos, de acordo com o Quadro 6 e o Quadro 7.
A seleção dos concelhos partiu de dois princípios:
Foi fixado em 10 o número total de entrevistas a realizar por ponto amostral, de modo a rentabilizar ao máximo as deslocações dos inquiridores mas prevenindo o efeito "tóxico" de entrevistar um grande numero de pessoas em localidades pequenas (Quadro 8);
Procedeu-se a uma distribuição equitativa das entrevistas atribuídas a cada estrato pelos concelhos que aí "caíam", visto que a proporcionalidade da dimensão das suas populações já tinha sido considerada na criação dos estratos (Quadro 8).
A repartição das entrevistas obtida respeitou a proporcionalidade da população das sub-regiões e dos estratos, garantindo simultaneamente a "pulverização" máxima pelos concelhos e salvaguardando a necessidade de uma concentração mínima de entrevistas que torne viável o trabalho de campo.
Esquema 1. Seleção das unidades primárias
2. Seleção das unidades secundárias (secções)
Conhecidas as entrevistas a realizar em cada concelho, o passo seguinte consistiu em selecionar aleatoriamente as unidades secundárias de amostragem (conglomerados). Partindo da divisão do país sob o ponto de vista estatístico, tal como é produzida pelo INE, foram identificadas as secções estatísticas que serviram de base à próxima etapa de seleção da amostra. As secções estatísticas agregam, em princípio, conjuntos de população com dimensões aproximadas, o que corresponde em meio urbano a áreas muito pequenas (por vezes alguns edifícios) mas que em meio rural pode corresponder a áreas de grande dimensão consoante a densidade populacional.
A seleção das secções estatísticas permitiu designar os espaços residenciais onde seriam realizadas as entrevistas. A cada um dos pontos amostrais foi atribuída uma quota de 10 entrevistas. O número de pontos amostrais por concelho foi calculado dividindo o número de entrevistas correspondente por 10. Nos casos em que a divisão não era inteira os pontos amostrais foram criados com um mínimo de sete e um máximo de doze entrevistas. O mapa do Quadro 9 apresenta a dispersão dos pontos amostrais.
Conhecido o número de secções em cada concelho procedeu-se ao sorteio das secções, utilizando para tal uma tabela de números aleatórios.
Esquema 2. Seleção das unidades secundárias
3. Seleção dos indivíduos
A segunda fase da determinação da amostra consistiu em proceder ao levantamento e enumeração da totalidade dos lares existentes dentro de cada secção estatística, a cargo dos entrevistadores, com recurso à cartografia (cartas 1:2000) obtida junto do INE. Os procedimentos para seleção da amostra foram previamente definidos de modo a retirar aos elementos das equipas no terreno (entrevistadores) qualquer iniciativa na escolha das secções, dos lares ou dos indivíduos.
O trabalho de campo consistiu no levantamento (listagem e anotação) exaustivo das habitações existentes, retirando da listagem todos os fogos não elegíveis para a amostra, nomeadamente espaços comerciais e de escritórios ou fogos desabitados. Depois de concluída a listagem de todas as habitações elegíveis procedeu-se a uma seleção sistemática dos lares a serem contactados, partindo da escolha do primeiro lar a ser contactado e do intervalo de seleção que permitiu selecionar os lares a contactar de seguida.
Após a seleção dos lares havia que proceder à seleção dos indivíduos, o que foi feito recorrendo a uma tabela de números aleatórios, construída com base na informação dos Censos sobre a composição dos agregados domésticos e que deveria garantir que a estrutura etária da amostra reproduzisse a da população portuguesa. O entrevistador utilizava a tabela de números aleatórios para selecionar o indivíduo a ser entrevistado não sendo possível, em caso algum, substituí-lo por outra pessoa, garantindo assim as condições de aleatoriedade do estudo.
2.2.3. Ponderação da amostra
Os resultados apresentados foram obtidos a partir de uma base ponderada no intuito de corrigir as distorções que a amostra sofreu quando se decidiu não respeitar a proporcionalidade direta do peso da população nas regiões, com o objetivo de obter uma amostra mais confortável nas regiões menos populosas.
2.2.4. Margens de erro
Foi seguida a metodologia empregue por Jacinto Rodrigues Osuna (responsável pelo estudo similar realizado em Espanha) para o cálculo das margens de erro que permite corrigir a fórmula do cálculo do erro para uma amostra aleatória, com os resultados dos cálculos do efeito de desenho amostral seguido (amostra polietápica estratificada por conglomerados). Os cálculos foram feitos para um nível de confiança máximo de 95,5% e são apresentados no Quadro 15.
3. Análise Quantitativa Utilizada
A análise de dados envolve três fases essenciais, pela seguinte ordem: (i) preparação dos dados; (ii) descrição dos dados; e, (iii) teste às hipóteses e modelos.
A preparação de dados envolve a verificação dos dados, o rigor dos mesmos, inserção e/ou tratamento dos dados no computador e o eventual desenvolvimento de base de dados que os integre.
A descrição dos dados, estatística descritiva, refere-se às características dos dados do estudo. Fornece informação sumária sobre a amostra e escalas de medida. Fornece análise simples de gráficos, descrevendo e mostrando os dados recolhidos.
A estatística inferencial trata das questões de investigação, das hipóteses e dos modelos. Muitas vezes as conclusões decorrentes da estatística inferencial vão além dos simples dados. Por exemplo, podem extrapolar e generalizar o que amostra diz para o universo da população, pode levar a juízos de probabilidades de uma diferença observada entre grupos se tornar numa relação de dependência em situação mais alargada.
A descrição dos dados pode ser volumosa, dependendo da dimensão do estudo, ainda que possa estar sintetizada em quadros e gráficos que condensam os dados.
O IDT utilizou os indicadores propostos pelo Observatório Europeu da Droga e Toxicodependência para efeitos de comparação internacional. O estudo do IDT identificou as seguintes variáveis:
perfil dos consumos
consumos de substâncias lícitas
consumos de substâncias ilícitas
vivências e representações dos riscos
Os indicadores utilizados para a análise das substâncias psicoativas foram os seguintes:
prevalência do consumo ao longo da vida
prevalência do consumo nos últimos 12 meses
padrão do consumo nos últimos 12 meses
prevalência do consumo nos últimos 30 dias
padrão do consumo nos últimos 30 dias
abandono do uso
circunstâncias de utilização
contextos e lugares de utilização
modos de acesso
motivações para o uso
modo de consumo
indicadores de situações de abuso
3.2. Consumo de Substâncias Psicoativas - análise de gráficos e tabelas
Iremos fazer apenas a análise dalguns dos dados constantes na Parte II e Parte III do estudo. A Parte II trata da prevalência do consumo de substâncias ilícitas e um dos primeiros gráficos apresentados compara grupos etários e respetivos consumos, medindo os respetivos consumos, em determinados períodos de tempo, e desenhando as suas tendências. A recolha continuada destes indicadores permite seguir a progressão ou o retrocesso dos consumos.
«Com esta preocupação o consumo aparecerá menos como uma unidade estatística, para passar a ser considerado, sobretudo, como um comportamento social, que se realiza de acordo com um certo número de modalidades, em circunstâncias bem precisas e em contextos diferenciados» (Parte III)
No gráfico 1 verifica-se uma prevalência de consumo da faixa etária dos 15 aos 34 anos em qualquer dos períodos de tempo considerados.
O gráfico 2 apresenta os consumos de substâncias por grupos etários, verificando-se que o consumo de cannabis é o que se destaca independentemente do grupo etário, embora os mais novos tenham um mais elevado consumo.
O volume de dados descritos no estudo é muito grande refletindo-se em múltiplas tabelas e gráficos, uma vez que analisa individualmente o consumo de cada tipo de substância ilícita, que abrange a cannabis, cocaína, ecstasy, heroína, anfetaminas, cogumelos mágicos e LSD.
O estudo faz uma comparação com os resultados obtidos num anterior Inquérito relativo ao ano de 2001, que permite verificar um aumento, desde então, do consumo de substâncias ilícitas.
A tabela 1 compara os resultados dos inquéritos de 2001 e 2007 quanto à prevalência do consumo de substâncias ilícitas, em termos de valores globais e em termos de faixa etária mais nova, sendo os valores e consumo dos mais novos superiores aos valores na globalidade.
Ao longo do estudo existem muitos gráficos e tabelas que tratam individualmente cada espécie de substância. O gráfico 10 compara a prevalência do consumo em geral por género e idade, verificando-se que o consumo diminui com o avanço da idade e que é superior nos homens.
O estudo analise a prevalência do consumo a nível regional, constatando-se valores mais elevados nas regiões de Lisboa e Algarve.
Na caracterização geral do consumo são apresentadas tabelas para cada uma das substâncias, pela extensão dos dados iremos apenas referir algumas no que respeita ao consumo da cannabis, que, como vimos anteriormente, representa o maior consumo entre as várias substâncias. Na tabela 71 verifica-se que há mais população a experimentar apenas uma vez na vida. A tabela dá-nos valores numéricos(frequências absolutas) e percentagens (frequências relativas).
Quanto número de vezes que consumiu no último ano, a percentagem mais elevada vai para quem consumiu menos de 1 vez por mês, embora 13% indique que consome várias vez ao dia.
A grande maioria da população inquirida declara-se abstinente, conforme tabela seguinte:
3.3. Variável Única
Ao analisar a variável da idade face ao consumo, são apresentadas as medidas de localização (a média, a mediana, a moda) e as medidas de distribuição (o desvio padrão, a amplitude).
Existem três características para uma única variável: (i) distribuição; (ii) tendência central; e, (iii) dispersão.
3.3.1. Distribuição
A distribuição é o sumário da frequência de valores individuais ou grupos de valores duma variável. Exemplo: listar o número de alunos duma escola por ano de escolaridade; ou listar a percentagem de alunos por género; ou listar percentagens de pessoas por faixas etárias
3.3.2. Medidas de Localização
A tendência central duma distribuição é uma estimativa de centrar uma distribuição de valores, existindo três tipos de estimativas:
Média - a estimativa da média é o método mais comum, medida de localização do centro da amostra.
Ex: (15+20+21+20+36+15+25+15) : 8 = 20,875
Mediana - é uma medida de localização do centro da distribuição dos dados, definida do seguinte modo: ordenados os elementos da amostra, a mediana é o valor (pertencente ou não à amostra) que a divide ao meio, isto é, 50% dos elementos da amostra são menores ou iguais à mediana e os outros 50% são maiores ou iguais à mediana. Para a sua determinação utiliza-se a seguinte regra, depois de ordenada a amostra de n elementos: Se n é ímpar, a mediana é o elemento médio; Se n é par, a mediana é a semi-soma dos dois elementos médios.
Moda - o valor que surge com mais frequência se os dados são discretos, ou, o intervalo de classe com maior frequência se os dados são contínuos. Assim, da representação gráfica dos dados, obtém-se imediatamente o valor que representa a moda ou a classe modal. Esta medida é especialmente útil para reduzir a informação de um conjunto de dados qualitativos, apresentados sob a forma de nomes ou categorias, para os quais não se pode calcular a média e por vezes a mediana (se não forem susceptíveis de ordenação).
3.3.3. Medidas de Dispersão
Vimos algumas medidas de localização do centro de uma distribuição de dados e agora vamos às medidas de distribuição que pretendem medir a variabilidade presente num conjunto de dados.
Um aspecto importante no estudo descritivo de um conjunto de dados, é o da determinação da variabilidade ou dispersão desses dados, relativamente à medida de localização do centro da amostra. Repare-se nas duas amostras seguintes, que embora tenham a mesma média, têm uma dispersão bem diferente:
Como a medida de localização mais utilizada é a média, será relativamente a ela que se define a principal medida de dispersão - a variância. Define-se a variância, e representa-se por s2, como sendo a medida que se obtém somando os quadrados dos desvios das observações da amostra, relativamente à sua média, e dividindo pelo número de observações da amostra menos um:
Uma vez que a variância envolve a soma de quadrados, a unidade em que se exprime não é a mesma que a dos dados. Assim, para obter uma medida da variabilidade ou dispersão com as mesmas unidades que os dados, tomamos a raiz quadrada da variância e obtemos o desvio padrão:
O desvio padrão é uma medida que só pode assumir valores não negativos e quanto maior for, maior será a dispersão dos dados. Algumas propriedades do desvio padrão, que resultam imediatamente da definição, são:
o desvio padrão é sempre não negativo e será tanto maior, quanta mais variabilidade houver entre os dados.
se s = 0, então não existe variabilidade, isto é, os dados são todos iguais.
A tabela 77 do estudo do IDT diz-nos que para o conjunto da população, a idade média do primeiro consumo é de 18 anos e a do último consumo é de 24 anos, sendo a sua duração média de 6 anos. As idades mais frequentes para iniciar e terminar o consumo são os 18 e 20 anos. A amplitude de variação das idades de início é bem mais reduzida do que a do último consumo: 3,9 e 7,7 anos, respetivamente. Estes valores são mais dilatados pelo facto dos extremos das séries de idades serem bastante afastados da média: 8 e 52 anos, para o primeiro, 8 e 56 anos, para o último consumo. Por essa razão, a mediana pode dar uma boa ideia da situação: 50% dos indivíduos não foram além dos 17 anos para fazerem o primeiro consumo e quando terminaram não tinham mais de 21 anos.
Quanto à associação dos consumos com diferentes tipos de atividades, constatamos que eles são mais frequentes nas situações de lazer (férias, fins de semana, momentos desocupados). No caso do consumo da cannabis, as ocasiões preferidas são as passagens de ano e os festivais de música, festas públicas e despedidas de solteiro.
Quanto às consequências negativas associadas ao consumo da cannabis (saúde, mau rendimento escola/trabalho, má conduta em casa) a maioria dos utilizadores (75,1%) realiza um consumo experimental. Dos restantes, a maioria considera não ter consequências negativas:
O estudo analisa também o consumo de substâncias lícitas, como o tabaco, o álcool e os medicamentos. No caso do álcool e do tabaco os consumos são mais elevados do que nas restantes substâncias. O consumo é mais elevado por parte dos homens e agravou-se, na generalidade, de 2001 para 2007.
4. Indicação de Testes Estatísticos Adicionais que poderiam ter sido realizados
Optamos um estudo muito intenso e de caráter profissional, pelo assumimos esta parte como uma espécie de comentário ao estudo que escolhemos, tendo em conta o profissionalismo de quem o fez e a nossa condição de amadores/aprendizes neste desafio. Dada a enorme quantidade de dados obtidos e tratados, ousamos inferir que é possível aplicar outros testes. O que pode ser questionado é, se de facto, esses testes eram necessários ou relevantes para os objetivos que este estudo se propunha alcançar.
O estudo refere que optaram pela aplicação de um inquérito à população em geral e que este pode não ser considerado o melhor instrumento para avaliar este tipo de consumo, no entanto é relevante que as duas escolhas que realizaram os orientem para o mesmo resultado. Segundo as várias fontes que temos vindo a consultar para realizar as atividades propostas neste seminário, se tivermos em conta a extensão e a dimensão da amostra (12202) e ainda a comparação de dados entre o ano 2001 e 2007 o inquérito, entre outras possibilidades, será um dos instrumentos mais adequados para a recolha de dados.
Tudo indica que o instrumento de recolha de dados já tinha sido validado, noutros contextos, uma vez que este estudo conheceu experiências percursoras em diversos países da União Europeia, bem como nos EUA e no Canadá. Pois, uma das pretensões dos investigadores era promover condições de comparabilidade de dados, quer com anos anteriores, quer a nível europeu e mesmo internacional. Assim sendo, para apresentar os dados nacionais foram privilegiados os indicadores internacionais de modo a permitir a comparação. Neste sentido pouco ou nada podemos inferir quanto à validade dos instrumentos utilizados.
Amostra do estudo é aleatória, mas proporcional quanto ao peso da população nas 7 regiões. O estudo está distribuído por 11 dimensões: Caraterização individual; Sociabilidades; Saúde e relação ao corpo; Atividades de lazer; Religião, Espiritualidade e crenças; Participação cívica, política e actividades de voluntariado; Caracterização dos membros do agregado doméstico; Substâncias psicoativas lícitas; Substâncias psicoativas ilícitas; Representações (bloco OEDT); Procedimentos de términus e de controlo. Em cada dimensão foram definidos indicadores.
Como já foi referido anteriormente, a maior parte dos dados foram tratados em quadros e gráficos, que apresentam dados referentes a frequências absolutas (N) e frequências relativas (%). Após a apresentação dos dados obtidos, são relacionados alguns indicadores que permitem a obtenção de valores para as medidas de localização (a média, a mediana, a moda) e as medidas de distribuição (o desvio padrão, a amplitude).
Se assumirmos como variáveis independentes (X), que são aquelas que influenciam, determinam ou afetam outra variável. Por exemplo:
Idade
Sexo
Indicador Socioprofissional de Classe de Origem
Estado Civil
Indicador de Rutura Familiar
Tipologia de Áreas Urbanas
Motivos de Não-Consumo de Substâncias Psicoativas Ilícitas nos Últimos Ano ou Mês
Nº vezes de consumo
Fontes Habituais/usuais de Obtenção de Substâncias Psicoativas Ilícitas
Locais Habituais/usuais de Consumo de Substâncias Psicoativas Ilícitas
Estas variáveis poderiam ser relacionadas com quase todos os indicadores, de todas as dimensões o que daria uma enormidade de resultados. Como foram por exemplo, com o Consumo de Substâncias Psicoativas Ilícitas ao Longo da Vida. Estas relações permitem-nos criar hipóteses e destas obtermos resultados aplicando o Teste Qui-quadrado. O teste do Qui-quadrado, estuda a relação entre duas variáveis, por si só ou divididas pelas categorias de terceiras variáveis.
H0- Hipótese nula – as variáveis são independentes, isto é os valores amostrais provêm de universos onde estas proporções são iguais. H1 - Hipótese alternativa- Existe relação entre as variáveis, isto é os valores amostrais provêm de universos onde estas proporções são significativamente diferentes. Quando o nível de significância do teste é inferior a 0,05, leva a rejeitar a hipótese nula ou seja as variáveis são independentes, o que significa não são iguais no universo da amostra. Nos valores de significância superiores a 0,05 o teste demonstra que a hipótese nula é verdadeira, ou seja existe relação entre as variáveis, isto é os valores amostrais provêm de universos onde estas proporções são iguais.
Por outro lado, após a obtenção de valores para as medidas de localização (a média, a mediana, a moda) e as medidas de distribuição (o desvio padrão, a amplitude, poderia ser oportuno fazer a representação gráfica em diagrama de extremos e quartis e Caixa dos bigodes que é um tipo de representação gráfica, em que se realçam algumas características da amostra. O conjunto dos valores da amostra compreendidos entre o 1º e o 3º QUARTIS, que vamos representar por Q1 e Q3 é representado por um retângulo (caixa) com a MEDIANA indicada por uma barra. A largura do retângulo não dá qualquer informação, pelo que pode ser qualquer. Consideram-se seguidamente duas linhas que unem os meios dos lados do retângulo com os extremos da amostra. Para obter esta representação, começa por se recolher da amostra, informação sobre 5 números, que são: os 2 extremos (mínimo e máximo), a mediana e o 1º e 3º quartis. A representação do diagrama de extremos e quartis tem o seguinte aspeto:
O extremo inferior é o mínimo da amostra, enquanto que o extremo superior é o máximo da amostra. Permite-nos verificar onde se concentram 50% das observações. As caixas de bigodes dão informação sobre: • A localização central: mediana; • Outras localizações: 1º e 3º quartis e mínimo e máximo; • Dispersão: amplitude e distância inter-quartil; • Assimetria: posição relativa da mediana na caixa, comprimento dos bigodes.
Salientamos a utilidade da representação em caixa de bigodes, porque este estudo assenta muito na comparação e as caixas de bigodes são úteis para comparar várias amostras num mesmo gráfico.
Para análise entre os grupos, por exemplo, se pretendermos saber se os 7 grupos (regiões) têm ou não médias iguais. Pode ser aplicado o método de análise de variância ANOVA – ANlysis Of Variance, ou seja é multivariada, por ter mais do que uma variável dependente.
Se a Significância é <0,05, é porque uma das médias é diferente das restantes. Assim, a ANOVA permite concluir: para qualquer nível de significância, as médias dos grupos não são todas iguais, o que quer dizer que existem diferenças significativas.
Se tivermos os dados numa base de dados, bem elaborada, num software como o O SPSS (Statistical Package for the Social Sciences), conseguimos ainda aplicar mais alguns testes. depende do objetivo a que nos propomos.
Referências Bibliográficas
ALEA. Ação Local de Estatística Aplicada. Disponível e consultado em Janeiro de 2012: http://www.alea.pt
Pestana, H. M & Gageiro, N. J. (2000). Análise de Dados para Ciências Sociais- A complementaridade do SPSS. 2ª edição. Lisboa:Edições Sílabo.
Trochim, William M. (2006).The Research Methods Knowledge Base, 2nd Edition. Disponível e consultado em Janeiro de 2012: http://www.socialresearchmethods.net/kb/
Tuckman, B. (2005). Manual de Investigação em Educação. Como conceber e realizar o processo de investigação em Educação. Fundação Calouste Gulbenkian.
Outras fontes de informação relacionadas com métodos quantitativos podem ser consultadas em:
This is your Sidebar, which you can edit like any other page in your workspace.
This Sidebar appears everywhere on your workspace. Add to it whatever you like -- a navigation section, a link to your favorite web sites, or anything else.
Comments (0)
You don't have permission to comment on this page.