🚑️ Update filter for Cyanide & Happiness
[rhynodge.git] / src / main / java / net / pterodactylus / rhynodge / filters / comics / CyanideAndHappinessComicFilter.java
1 /*
2  * rhynodge - CyanideAndHappinessComicFilter.java - Copyright © 2013 David Roden
3  *
4  * This program is free software: you can redistribute it and/or modify
5  * it under the terms of the GNU General Public License as published by
6  * the Free Software Foundation, either version 3 of the License, or
7  * (at your option) any later version.
8  *
9  * This program is distributed in the hope that it will be useful,
10  * but WITHOUT ANY WARRANTY; without even the implied warranty of
11  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12  * GNU General Public License for more details.
13  *
14  * You should have received a copy of the GNU General Public License
15  * along with this program.  If not, see <http://www.gnu.org/licenses/>.
16  */
17
18 package net.pterodactylus.rhynodge.filters.comics;
19
20 import static com.google.common.base.Optional.absent;
21 import static com.google.common.base.Optional.of;
22
23 import java.net.URI;
24 import java.net.URISyntaxException;
25 import java.net.URL;
26 import java.util.Collections;
27 import java.util.List;
28
29 import net.pterodactylus.rhynodge.filters.ComicSiteFilter;
30
31 import com.google.common.base.Function;
32 import com.google.common.base.Optional;
33 import com.google.common.collect.FluentIterable;
34 import org.jsoup.nodes.Document;
35 import org.jsoup.nodes.Element;
36 import org.jsoup.select.Elements;
37
38 /**
39  * {@link ComicSiteFilter} implementation that can parse Cyanide and Happiness
40  * comics.
41  *
42  * @author <a href="mailto:bombe@pterodactylus.net">David ‘Bombe’ Roden</a>
43  */
44 public class CyanideAndHappinessComicFilter extends ComicSiteFilter {
45
46         @Override
47         protected Optional<String> extractTitle(Document document) {
48                 return extractImageUrls(document).isEmpty() ? absent() : of("");
49         }
50
51         @Override
52         protected List<String> extractImageUrls(Document document) {
53                 Elements imageTags = document.select(".MainComic__ComicImage-sc-ndbx87-2 > span noscript img");
54                 return FluentIterable.from(imageTags).transform(new Function<Element, String>() {
55
56                         @Override
57                         public String apply(Element input) {
58                                 String imageUrl = input.attr("src");
59                                 try {
60                                         return new URI(document.baseUri()).resolve(imageUrl).toString();
61                                 } catch (URISyntaxException e) {
62                                         /* ignore. */
63                                 }
64                                 if (!imageUrl.startsWith("/")) {
65                                         return imageUrl;
66                                 }
67                                 String protocol = document.baseUri().substring(0, document.baseUri().indexOf('/'));
68                                 return protocol + imageUrl;
69                         }
70                 }).toList();
71         }
72
73         @Override
74         protected List<String> extractImageComments(Document document) {
75                 return Collections.emptyList();
76         }
77
78 }