Show Internacional x Grêmio (GRENAL) é uma das maiores rivalidades do futebol mundial. Semelhante a Boca Juniors x RIver Plate (Buenos Aires, Argentina). Lazio x Roma (Roma, Itália) e Barcelona x Real Madrid (Espanha) kk. Hoje nós vamos utilizar das técnicas de ciência de dados pra comparar os dois clubes e ver qual é o maior, usando como critério o número de campeonatos ganhos. Como existem vários tipos de títulos, vamos olhar apenas para os torneios mais expressivos do Rio Grande do Sul, Brasil e América do Sul. Após carregar os pacotes padrões pra um projeto de data science (pandas, numpy e etc) que tu já sabe, estamos aptos a começar a brincadeira. Para carregar datasets direto da web, existe o método read_html() do pandas. Usando esse método em sites que contenham mais de uma tabela (como geralmente é o caso da Wikipédia) uma lista contendo todas as tabelas vai ser retornada. Então, a gente precisa especificar qual vamos usar. Se tu abrir o link lá da Wikipédia, vai ver que é a primeira lista a que interessa, ou seja, a [0]. Com os datasets carregados, vamos dar uma olhada em como os dataframes ficaram. Aqui a gente usa o bom e velho .head(). Antes de mais nada, vamos remover as 'Unnameds', que eram os divisores das tabelas (multinível). Daí vamos de .drop(). Então, cada dataframe fica dessa maneira: Certo, cada um deles possui um monte de probleminhas, por conta dos dados tabulados da Wikipédia terem vários separadores (uns subtitulos dizendo qual categoria o campeonato pertence). Então, vamos selecionar apenas as linhas que contenham os torneios que a gente quer ver. Isso elimina o erro dos "INTERESTADUAIS", "ESTADUAIS" e etc, e também a gente já filtra pras competições que nos interessam. Os torneios que a gente quer ver são:
Para fazer isso, vamos criar uma lista contendo todos os valores que correspondem a esses campeonatos aí (removendo os que dizem "recordistas" pelo internacional), e testar se a linha da competição corresponde a algum dos campeonatos, utilizando o .isin() E pra fins didáticos, vamos criar uma coluna em cada dataframe pra indicar o time que ele corresponde. Com os dados limpos e demarcados, vamos uni-los para ser mais facil analisá-lo. Podemos fazer isso com um simples .append(). Vendo o dataframe que temos agora, é essa belezura aqui: O interessante dessa área, é que da pra fazer uma coisa de várias maneiras. Existem as mais recomendadas, e as que funcionam também kk.Vamos dar um fix na coluna títulos, que não está numérica, e criar um outro dataframe pra armazenar o total de títulos agrupando por clube. Por fim a gente tem isso aqui: Um dos pontos mais importantes de um projeto de data science (independente do tamanho dele) é a visualização dos dados, que realmente explique o problema que o próprio projeto se propôs em responder. No nosso caso, queremos visualizar qual clube tem o maior número de títulos totais, ao mesmo tempo em que comparamos cada título entre os clubes. Com a visualização dos títulos mais expressivos, pro contexto gaúcho, vemos que o internacional tem mais títulos totais que o Grêmio. Porém, o Grêmio tem mais Copa do Brasil. Então, no contexto do Rio Grande do Sul, S.C. Internacional é o maior clube de futebol! é us guri pae Quem tem mais títulos o Inter ou o Grêmio?No número de títulos estaduais, a vitória vai para o... Colorado! O Internacional venceu por 45 vezes, enquanto que o Grêmio conta com 40 conquistas, ficando ligeiramente abaixo do grande rival.
Quem é o melhor time do Sul?RANKING CBF - 2023
Nessa temporada de 2022, os clubes gaúchos, em especial a dupla grenal tiveram baixas de posições. Agora o melhor gaúcho ranqueado é o Internacional que mesmo com o vice-campeonato brasileiro ocupa a décima colocação.
Quem tem mais títulos no Rio Grande do Sul?O Internacional é o maior vencedor da competição, com 45 títulos, seguido pelo Grêmio com 41 títulos e o Guarany com dois títulos.
|